Укр Рус
20 лютого, 12:24
4

Google випускає оновлену версію Gemini з кращими можливостями, ніж будь-коли

Основні тези
  • Google представила Gemini 3.1 Pro, яка суттєво покращила логічне мислення та здатність вирішувати нетипові проблеми, перевершивши попередню версію та конкурента GPT 5.2 у тестах на логіку.
  • Gemini 3.1 Pro може генерувати анімовані SVG-зображення з текстового запиту та синтезувати складні дані, демонструючи високий рівень інтерактивного дизайну та креативного програмування.

Google оголошує про вихід Gemini 3.1 Pro, наступного етапу розвитку екосистеми штучного інтелекту компанії. Лише за три місяці після попереднього великого оновлення розробники змогли суттєво покращити здатність до логічного мислення та вирішення нетипових проблем. Це оновлення відкриває двері до складніших сценаріїв використання.

Які технологічні прориви та практичні інструменти приносить Gemini 3.1 Pro?

Представлена модель Gemini 3.1 Pro базується на "оновленому інтелектуальному ядрі", яке вперше з'явилося минулого тижня у спеціалізованому інструменті Gemini 3 Deep Think. Це оновлення фокусується на здатності штучного інтелекту розв'язувати завдання, де простої відповіді недостатньо, а потрібне глибоке розуміння контексту й синтез даних, пише Mint.

Дивіться також Gemini запускає генерацію музики для всіх за допомогою Lyria 3 

  • Головною гордістю розробників стали результати тестів на логіку. Зокрема, у бенчмарку ARC-AGI-2, який оцінює вміння моделі знаходити рішення для абсолютно нових логічних патернів, 3.1 Pro набрала 77.1 %, показують дані Google. Це більш ніж удвічі перевищує показники попередньої версії 3.0 Pro, яка демонструвала лише 31.1 %.
  • У тесті Humanity's Last Exam, що перевіряє знання у складних специфічних завданнях, нова модель також встановила рекорд із показником 44.4 %, обійшовши як свою попередницю, так і конкурента GPT 5.2 від OpenAI, результат якого склав 34.5 %.
  • Хоча в деяких аспектах, наприклад у написанні коду за версією Arena, модель Claude Opus 4.6 все ще утримує лідерство з невеликим відривом, Google впевнено домінує в галузі агентних робочих процесів.
  • У бенчмарку APEX-Agents модель Gemini 3.1 Pro майже вдвічі покращила свій результат, що свідчить про її високу ефективність у виконанні багатоетапних професійних завдань.


Результати тестів Gemini 3.1 Pro / Зображення Google

А нам що з того?

Практичне застосування покращеного інтелекту розробники продемонстрували на кількох вражаючих прикладах. Модель здатна генерувати анімовані SVG-зображення безпосередньо з текстового запиту. Перші користувачі вже порівняли результати, і вони разюче кращі.

Порівняння результатів роботи Gemini 3 Pro і Gemini 3.1 Pro: дивіться відео

Оскільки вони створюються у вигляді чистого коду, а не пікселів, такі файли залишаються чіткими при будь-якому масштабуванні та мають мінімальний розмір порівняно зі звичайним відео.

Порівняння результатів роботи Gemini 3 Pro і Gemini 3.1 Pro: дивіться відео

Також була показана здатність системи синтезувати складні дані: нейромережа створила робочу панель аерокосмічного моніторингу, налаштувавши потік телеметрії для візуалізації орбіти Міжнародної космічної станції в реальному часі.

Окрему увагу приділено інтерактивному дизайну та креативному програмуванню. Gemini 3.1 Pro змогла не лише відтворити візуальну симуляцію руху зграї птахів, а й побудувати імерсивний досвід, де користувач може керувати потоком за допомогою жестів, а генеративний звук змінюється відповідно до рухів об'єктів.

Симуляція руху птахів з музикою в Gemini 3.1 Pro: дивіться відео

У творчому експерименті модель перенесла атмосферу роману "Буремний перевал" Емілі Бронте у дизайн сучасного веб-інтерфейсу, проаналізувавши літературні теми твору.

Доступність

Наразі Gemini 3.1 Pro перебуває на стадії попереднього перегляду. Вона вже доступна для передплатників Google AI Pro та Ultra у додатку Gemini та сервісі NotebookLM. Розробники та корпоративні клієнти можуть випробувати її через Gemini API в Google AI Studio, Vertex AI та Android Studio.

Повноцінний реліз очікується найближчим часом.

Параметри

Технічні параметри моделі залишилися стабільними: вікно контексту становить 1 мільйон вхідних токенів та 64 000 вихідних токенів, пише Ars Technica, а вартість використання для розробників складає 2 долари за мільйон вхідних та 12 доларів за мільйон вихідних токенів.