Google представляє нову модель Gemini, заявляючи, що вона розумніша за ChatGPT та DeepSeek

Основні тези

Google представляє нову модель штучного інтелекту Gemini 2.5 Pro Experimental, яка перевершує інші моделі за інтелектом та можливостями міркування.
Gemini 2.5 Pro доступна на платформі Google AI Studio та в додатку Gemini для передплатників, підтримує до 1 мільйона токенів, що дозволяє обробляти великі обсяги тексту.
Модель перевершила конкурентів у тестах на редагування коду та розробку програмного забезпечення.

У вівторок компанія Google представила нове сімейство моделей штучного інтелекту Gemini 2.5, які роблять паузу, щоб "подумати", перш ніж відповісти на питання. Мультимодальна Gemini 2.5 Pro Experimental, як стверджує компанія, є найінтелектуальнішою на сьогодні.

Gemini 2.5 Pro Experimental вже доступна на платформі для розробників Google AI Studio, а також у додатку Gemini для передплатників тарифного плану Gemini Advanced вартістю 20 доларів на місяць. У майбутньому, як заявляє Google, всі нові моделі ШІ матимуть вбудовані можливості міркування, повідомляє 24 Канал з посиланням на блог Google.

Дивіться також Увімкніть цю нову функцію вашої мобільної клавіатури, на яку всі чекали роками

Найкращий з найкращих

Відтоді, як у вересні 2024 року OpenAI запустила першу модель міркувань ШІ o1, технологічна індустрія змагалася, щоб зрівнятися або перевершити можливості цієї моделі у своїх розробках. Сьогодні Anthropic, DeepSeek, Google та xAI мають моделі міркувань, які використовують додаткову обчислювальну потужність і час для перевірки фактів і міркувань над проблемами перед тим, як надати відповідь.

Методи міркувань допомогли моделям ШІ досягти нових висот у вирішенні математичних і кодувальних завдань. Багато хто у світі технологій вважає, що моделі міркувань стануть ключовим компонентом ШІ-агентів – автономних систем, здатних виконувати завдання практично без втручання людини. Однак ці моделі також і дорожчі.

Google і раніше експериментував з моделями міркувань ШІ, випустивши в грудні "мислячу" версію Gemini. Але Gemini 2.5 – це найсерйозніша спроба компанії перевершити моделі OpenAI серії "o".

Розробники стверджують, що Gemini 2.5 Pro перевершує попередні передові моделі ШІ, а також деякі з провідних конкуруючих моделей ШІ за кількома показниками. Зокрема, компанія каже, що розробила Gemini 2.5 для створення візуально привабливих веб-додатків і додатків з агентним кодуванням.

Gemini 2.5 – це модель мислення, розроблена для вирішення дедалі складніших завдань. Наша перша модель 2.5, Gemini 2.5 Pro Experimental, випереджає загальноприйняті бенчмарки зі значним відривом і демонструє сильні міркування та можливості коду,
– йдеться в заяві компанії.

У тесті Aider Polyglot, який вимірює можливості редагування коду, Gemini 2.5 Pro набрав 68,6%, випередивши найкращі моделі штучного інтелекту від OpenAI, Anthropic та китайської лабораторії DeepSeek.
В іншому тесті, що вимірює здібності розробників програмного забезпечення, SWE-bench Verified, Gemini 2.5 Pro набрав 63,8%, випередивши o3-mini від OpenAI і R1 від DeepSeek, але відстає від Claude 3.7 Sonnet компанії Anthropic, який набрав 70,3%.
На так званому "останньому іспиті людства", мультимодальному тесті, що складається з тисяч різних питань з математики, гуманітарних та природничих наук, Gemini 2.5 Pro набрав 18,8%, що є кращим результатом, ніж у більшості конкуруючих флагманських моделей.

Результати тестів / Фото Google

Gemini 2.5 Pro Experimental також лідирує в математичних тестах і тестах генерації коду AIME 2025 і LiveCodeBench v5. Компанія стверджує, що 2.5 являє собою "великий стрибок" в продуктивності кодування в порівнянні з попередньою версією.

Порівняння різних моделей від різних розробників / Фото Google

Варто зазначити, що 25 березня DeepSeek також випустив нову версію своєї моделі під назвою V3. Невідомо, як вона порівнюється з Gemini 2.5, оскільки Google тестував свою технологію на іншій моделі DeepSeek R1.

Модель Google сприймає запити за допомогою тексту, аудіо, відео та зображень, але видає результат лише текстом. Її знання обриваються в січні 2025 року.

Google заявляє, що Gemini 2.5 Pro постачається з контекстним вікном на 1 мільйон токенів, що означає, що ШІ-модель може сприймати приблизно 750 000 слів за один прохід. Це більше, ніж вся серія книг "Володар перснів". Незабаром Gemini 2.5 Pro буде підтримувати вдвічі більшу довжину вхідних даних – 2 мільйони токенів.

Google не опублікував ціни на API для Gemini 2.5 Pro. Компанія каже, що надасть більше інформації в найближчі тижні.

Пов'язані теми:

Техно

Штучний інтелект

Google Google Gemini