Google представил Gemini 20 – ИИ помощник на каждый день, который изменит вашу жизнь

Михаил Года

Модель Gemini 2․0 от Google - возможности обновленного искусственного интеллекта - Техно

Gemini 2.0 / Google

Новая модель искусственного интеллекта от Google, Gemini 2.0, имеет целью революционизировать восприятие искусственного интеллекта благодаря своим мультимодальным возможностям генерирования текста, звука и изображений. Она должна стать следующим шагом к агентному ИИ – когда боты могут выполнять задачи от имени пользователей.

Google официально запустил свою долгожданную модель искусственного интеллекта Gemini 2.0, позиционируя ее как трансформационный шаг в эволюции искусственного интеллекта, сообщает 24 Канал со ссылкой на The Verge.

А тем временем OpenAI выпустила видеогенератор Sora, но доступен он не всем

Благодаря способности обрабатывать и генерировать текст, звук и изображения, Gemini 2.0 был назван генеральным директором Google DeepMind Демисом Хассабисом "всеобъемлющей" системой. Это обновление вышло через 10 месяцев после релиза Gemini 1.5 и приближает Google к своему видению агентных систем ИИ-АИ, способных действовать автономно по командам пользователей.

Gemini 2.0 – возможности ИИ

Агентный ИИ

Ключевой особенностью Gemini 2.0 является поддержка агентного ИИ – технологии, которая позволяет ИИ-ботам выполнять действия от имени пользователей. Хассабис подчеркнул, что эта модель закладывает основу для "настоящего начала эры агентного ИИ" в 2025 году. Ранние итерации этой концепции уже можно увидеть в экспериментальных проектах Google, таких как Project Astra и Project Mariner.

Project Astra: Визуальная система, предназначена для распознавания объектов, помощи в навигации и поиска потерянных предметов. Gemini 2.0 значительно расширяет ее возможности.
Project Mariner: Расширение для браузера Chrome, которое действует как суррогат пользователя во время просмотра веб-страниц, выполняя задачи от его имени.
Jules Agent: Инструмент поддержки разработчиков, который обнаруживает и исправляет ошибки в программном коде.

Существует даже агент с искусственным интеллектом, который помогает геймерам в выборе стратегии игры. Все эти проекты подчеркивают потенциал Gemini 2.0 для автоматизации сложных, многоэтапных процессов.

Мультимодальность и повышение производительности

В отличие от предыдущих моделей, которые специализировались на изолированных задачах, Gemini 2.0 фокусируется на универсальности.

Мультимодальность, различные типы результатов, функции – цель состоит в том, чтобы включить все это в основную модель Gemini,
– сказал Хассабис.

Интегрируя как можно больше функций в единую модель ИИ, Google стремится создать систему "общего назначения", способную удовлетворить разнообразные потребности пользователей.

В дополнение к расширенным возможностям, Gemini 2.0 может похвастаться повышенной производительностью и энергоэффективностью. Это происходит в решающий момент, когда индустрия искусственного интеллекта переживает общее замедление технологического прогресса.

Хотя другие технологические гиганты, такие как Amazon, Microsoft, Anthropic и OpenAI, занимаются аналогичными поисками, акцент Google на энергоэффективности и сокращении расходов может дать ему конкурентное преимущество.

Решение старых и новых проблем

По мере того, как ИИ все больше интегрируется в повседневную жизнь, Gemini 2.0 стремится решить как давние, так и новые проблемы. Традиционные вызовы включают оптимизацию производительности, эффективность и стоимость вывода (процесс, с помощью которого ИИ-модели принимают решения).

Новые вызовы, однако, сосредоточены на рисках для безопасности и конфиденциальности, особенно в агентном ИИ, где боты действуют от имени пользователей.

Экспериментальная версия и планы на будущее

Сейчас Gemini 2.0 доступен как "экспериментальная предварительная версия" в облегченном варианте под названием Gemini 2.0 Flash. Google планирует выпустить полную версию в начале следующего года. Объединив несколько функций в одну надежную модель, компания стремится интегрировать Gemini 2.0 в широкий спектр своих продуктов и услуг.

"Мы стараемся создать как можно более универсальную модель", – объяснил Хассабис, подчеркивая стремление компании уменьшить потребность в отдельных специализированных инструментах ИИ.

Взяв за основу Gemini 2.0, Google стремится привести индустрию искусственного интеллекта в эру агентов, где AI-боты не только будут помогать пользователям, но и во многих случаях будут выполнять за них рутинные задачи.