Google офіційно запустив свою довгоочікувану модель штучного інтелекту Gemini 2.0, позиціонуючи її як трансформаційний крок в еволюції штучного інтелекту, повідомляє 24 Канал з посиланням на The Verge.

А тим часом OpenAI випустила відеогенератор Sora, але доступний він не всім

Завдяки здатності обробляти та генерувати текст, звук і зображення, Gemini 2.0 був названий генеральним директором Google DeepMind Демісом Хассабісом "всеосяжною" системою. Це оновлення вийшло через 10 місяців після релізу Gemini 1.5 і наближає Google до свого бачення агентних систем ШІ-АІ, здатних діяти автономно за командами користувачів.

Gemini 2.0 – можливості ШІ

Агентний ШІ

Ключовою особливістю Gemini 2.0 є підтримка агентного ШІ – технології, яка дозволяє ШІ-ботам виконувати дії від імені користувачів. Хассабіс підкреслив, що ця модель закладає основу для "справжнього початку ери агентного ШІ" у 2025 році. Ранні ітерації цієї концепції вже можна побачити в експериментальних проектах Google, таких як Project Astra і Project Mariner.

  • Project Astra: Візуальна система, призначена для розпізнавання об'єктів, допомоги в навігації та пошуку загублених предметів. Gemini 2.0 значно розширює її можливості.
  • Project Mariner: Розширення для браузера Chrome, яке діє як сурогат користувача під час перегляду веб-сторінок, виконуючи завдання від його імені.
  • Jules Agent: Інструмент підтримки розробників, який виявляє та виправляє помилки в програмному коді.

Існує навіть агент зі штучним інтелектом, який допомагає геймерам у виборі стратегії гри. Всі ці проекти підкреслюють потенціал Gemini 2.0 для автоматизації складних, багатоетапних процесів.

Мультимодальність і підвищення продуктивності

На відміну від попередніх моделей, які спеціалізувалися на ізольованих завданнях, Gemini 2.0 фокусується на універсальності.

Мультимодальність, різні типи результатів, функції – мета полягає в тому, щоб включити все це в основну модель Gemini,
– сказав Хассабіс.

Інтегруючи якомога більше функцій в єдину модель ШІ, Google прагне створити систему "загального призначення", здатну задовольнити різноманітні потреби користувачів.

На додаток до розширених можливостей, Gemini 2.0 може похизуватися підвищеною продуктивністю та енергоефективністю. Це відбувається у вирішальний момент, коли індустрія штучного інтелекту переживає загальне уповільнення технологічного прогресу.

Хоча інші технологічні гіганти, такі як Amazon, Microsoft, Anthropic і OpenAI, займаються аналогічними пошуками, акцент Google на енергоефективності та скороченні витрат може дати йому конкурентну перевагу.

Вирішення старих і нових проблем

У міру того, як ШІ все більше інтегрується в повсякденне життя, Gemini 2.0 прагне вирішити як давні, так і нові проблеми. Традиційні виклики включають оптимізацію продуктивності, ефективність і вартість виведення (процес, за допомогою якого ШІ-моделі приймають рішення).

Нові виклики, однак, зосереджені на ризиках для безпеки та конфіденційності, особливо в агентному ШІ, де боти діють від імені користувачів.

Експериментальна версія та плани на майбутнє

Наразі Gemini 2.0 доступний як "експериментальна попередня версія" у полегшеному варіанті під назвою Gemini 2.0 Flash. Google планує випустити повну версію на початку наступного року. Об'єднавши кілька функцій в одну надійну модель, компанія прагне інтегрувати Gemini 2.0 в широкий спектр своїх продуктів і послуг.

"Ми намагаємося створити якомога більш універсальну модель", – пояснив Хассабіс, підкреслюючи прагнення компанії зменшити потребу в окремих спеціалізованих інструментах ШІ.

Дивіться також Штучний інтелект Ілона Маска тепер доступний для всіх з функцією генерування зображень

Взявши за основу Gemini 2.0, Google прагне привести індустрію штучного інтелекту в еру агентів, де AI-боти не лише допомагатимуть користувачам, але й у багатьох випадках виконуватимуть за них рутинні завдання.