Google официально запустил свою долгожданную модель искусственного интеллекта Gemini 2.0, позиционируя ее как трансформационный шаг в эволюции искусственного интеллекта, сообщает 24 Канал со ссылкой на The Verge.
А тем временем OpenAI выпустила видеогенератор Sora, но доступен он не всем
Благодаря способности обрабатывать и генерировать текст, звук и изображения, Gemini 2.0 был назван генеральным директором Google DeepMind Демисом Хассабисом "всеобъемлющей" системой. Это обновление вышло через 10 месяцев после релиза Gemini 1.5 и приближает Google к своему видению агентных систем ИИ-АИ, способных действовать автономно по командам пользователей.
Gemini 2.0 – возможности ИИ
Агентный ИИ
Ключевой особенностью Gemini 2.0 является поддержка агентного ИИ – технологии, которая позволяет ИИ-ботам выполнять действия от имени пользователей. Хассабис подчеркнул, что эта модель закладывает основу для "настоящего начала эры агентного ИИ" в 2025 году. Ранние итерации этой концепции уже можно увидеть в экспериментальных проектах Google, таких как Project Astra и Project Mariner.
- Project Astra: Визуальная система, предназначена для распознавания объектов, помощи в навигации и поиска потерянных предметов. Gemini 2.0 значительно расширяет ее возможности.
- Project Mariner: Расширение для браузера Chrome, которое действует как суррогат пользователя во время просмотра веб-страниц, выполняя задачи от его имени.
- Jules Agent: Инструмент поддержки разработчиков, который обнаруживает и исправляет ошибки в программном коде.
Существует даже агент с искусственным интеллектом, который помогает геймерам в выборе стратегии игры. Все эти проекты подчеркивают потенциал Gemini 2.0 для автоматизации сложных, многоэтапных процессов.
Мультимодальность и повышение производительности
В отличие от предыдущих моделей, которые специализировались на изолированных задачах, Gemini 2.0 фокусируется на универсальности.
Мультимодальность, различные типы результатов, функции – цель состоит в том, чтобы включить все это в основную модель Gemini,
– сказал Хассабис.
Интегрируя как можно больше функций в единую модель ИИ, Google стремится создать систему "общего назначения", способную удовлетворить разнообразные потребности пользователей.
В дополнение к расширенным возможностям, Gemini 2.0 может похвастаться повышенной производительностью и энергоэффективностью. Это происходит в решающий момент, когда индустрия искусственного интеллекта переживает общее замедление технологического прогресса.
Хотя другие технологические гиганты, такие как Amazon, Microsoft, Anthropic и OpenAI, занимаются аналогичными поисками, акцент Google на энергоэффективности и сокращении расходов может дать ему конкурентное преимущество.
Решение старых и новых проблем
По мере того, как ИИ все больше интегрируется в повседневную жизнь, Gemini 2.0 стремится решить как давние, так и новые проблемы. Традиционные вызовы включают оптимизацию производительности, эффективность и стоимость вывода (процесс, с помощью которого ИИ-модели принимают решения).
Новые вызовы, однако, сосредоточены на рисках для безопасности и конфиденциальности, особенно в агентном ИИ, где боты действуют от имени пользователей.
Экспериментальная версия и планы на будущее
Сейчас Gemini 2.0 доступен как "экспериментальная предварительная версия" в облегченном варианте под названием Gemini 2.0 Flash. Google планирует выпустить полную версию в начале следующего года. Объединив несколько функций в одну надежную модель, компания стремится интегрировать Gemini 2.0 в широкий спектр своих продуктов и услуг.
"Мы стараемся создать как можно более универсальную модель", – объяснил Хассабис, подчеркивая стремление компании уменьшить потребность в отдельных специализированных инструментах ИИ.
Смотрите также Искусственный интеллект Илона Маска теперь доступен для всех с функцией генерирования изображений
Взяв за основу Gemini 2.0, Google стремится привести индустрию искусственного интеллекта в эру агентов, где AI-боты не только будут помогать пользователям, но и во многих случаях будут выполнять за них рутинные задачи.