363
Google представляє нову модель Gemini, заявляючи, що вона розумніша за GhatGPT та DeepSeek
— Технології&Авто
У вівторок компанія Google представила нове сімейство моделей штучного інтелекту Gemini 2.5, які роблять паузу, щоб «подумати», перш ніж відповісти на питання. Мультимодальна Gemini 2.5 Pro Experimental, як стверджує компанія, є найінтелектуальнішою на сьогодні.
Gemini 2.5 Pro Experimental вже доступна на платформі для розробників Google AI Studio, а також у додатку Gemini для передплатників тарифного плану Gemini Advanced вартістю 20 доларів на місяць. У майбутньому, як заявляє Google, всі нові моделі ШІ матимуть вбудовані можливості міркування.
Відтоді, як у вересні 2024 року OpenAI запустила першу модель міркувань ШІ o1, технологічна індустрія змагалася, щоб зрівнятися або перевершити можливості цієї моделі у своїх розробках. Сьогодні Anthropic, DeepSeek, Google та xAI мають моделі міркувань, які використовують додаткову обчислювальну потужність і час для перевірки фактів і міркувань над проблемами перед тим, як надати відповідь.
Методи міркувань допомогли моделям ШІ досягти нових висот у вирішенні математичних і кодувальних завдань. Багато хто у світі технологій вважає, що моделі міркувань стануть ключовим компонентом ШІ-агентів — автономних систем, здатних виконувати завдання практично без втручання людини. Однак ці моделі також і дорожчі.
Google і раніше експериментував з моделями міркувань ШІ, випустивши в грудні «мислячу» версію Gemini. Але Gemini 2.5 — це найсерйозніша спроба компанії перевершити моделі OpenAI серії «o».
Розробники стверджують, що Gemini 2.5 Pro перевершує попередні передові моделі ШІ, а також деякі з провідних конкуруючих моделей ШІ за кількома показниками. Зокрема, компанія каже, що розробила Gemini 2.5 для створення візуально привабливих веб-додатків і додатків з агентним кодуванням.
«Gemini 2.5 — це модель мислення, розроблена для вирішення дедалі складніших завдань. Наша перша модель 2.5, Gemini 2.5 Pro Experimental, випереджає загальноприйняті бенчмарки зі значним відривом і демонструє сильні міркування та можливості коду», — йдеться в заяві компанії.
У тесті Aider Polyglot, який вимірює можливості редагування коду, Gemini 2.5 Pro набрав 68,6%, випередивши найкращі моделі штучного інтелекту від OpenAI, Anthropic та китайської лабораторії DeepSeek.
В іншому тесті, що вимірює здібності розробників програмного забезпечення, SWE-bench Verified, Gemini 2.5 Pro набрав 63,8%, випередивши o3-mini від OpenAI і R1 від DeepSeek, але відстає від Claude 3.7 Sonnet компанії Anthropic, який набрав 70,3%.
На так званому «останньому іспиті людства», мультимодальному тесті, що складається з тисяч різних питань з математики, гуманітарних та природничих наук, Gemini 2.5 Pro набрав 18,8%, що є кращим результатом, ніж у більшості конкуруючих флагманських моделей.

Gemini 2.5 Pro Experimental також лідирує в математичних тестах і тестах генерації коду AIME 2025 і LiveCodeBench v5. Компанія стверджує, що 2.5 являє собою «великий стрибок» в продуктивності кодування в порівнянні з попередньою версією.

Модель Google сприймає запити за допомогою тексту, аудіо, відео та зображень, але видає результат лише текстом. Її знання обриваються в січні 2025 року.
Google заявляє, що Gemini 2.5 Pro постачається з контекстним вікном на 1 мільйон токенів, що означає, що ШІ-модель може сприймати приблизно 750 000 слів за один прохід. Це більше, ніж вся серія книг «Володар перснів». Незабаром Gemini 2.5 Pro буде підтримувати вдвічі більшу довжину вхідних даних — 2 мільйони токенів.
Google не опублікував ціни на API для Gemini 2.5 Pro. Компанія каже, що надасть більше інформації в найближчі тижні.
За матеріалами: Телеканал 24
Поділитися новиною