Google представила новые открытые AI-модели Gemma 3: быстрые, экономные и готовые для смартфонов

Михаил Года

Основні тези

Google представила третье поколение открытых AI-моделей Gemma 3, которые отличаются производительностью и могут работать на различных устройствах, включая смартфоны.
Gemma 3 поддерживает более 140 языков, является мультимодальной, имеет открытое программное обеспечение и может взаимодействовать с внешними базами данных, что делает ее конкурентоспособной с другими популярными AI-моделями.

Google продолжает развивать направление искусственного интеллекта, и помимо собственных моделей Gemini, которые интегрированы в сервисы компании, также выпускает открытые модели под брендом Gemma. Компания представила третье поколение открытых AI-моделей Gemma 3, которые отличаются производительностью и возможностью работы на различных устройствах от смартфонов до мощных рабочих станций.

Gemma 3 выпущена в четырех вариантах – с 1, 4, 12 и 27 миллиардами параметров, рассказывает 24 Канал. Google заявляет, что эта модель является лучшей среди однопроцессорных AI-моделей в мире, поскольку она может работать на одном графическом (GPU) или тензорном процессоре (TPU), а не требовать целый кластер. Это означает, что Gemma 3 можно запускать даже на TPU-чипах смартфонов Pixel, как и модель Gemini Nano.

А тем временем Новая ИИ-модель OpenAI пишет художественные тексты на уровне лучших писателей

Главным преимуществом Gemma 3 над моделями Gemini является ее открытый исходный код, что позволяет разработчикам интегрировать ее в свои мобильные приложения и программное обеспечение. Модель поддерживает более 140 языков, из которых 35 входят в предварительно обученный пакет.

Как и Gemini 2.0, новая AI-модель способна работать с текстом, изображениями и видео, что делает ее мультимодальной. По заявлениям Google, Gemma 3 превосходит популярные открытые AI-модели, такие как DeepSeek V3, OpenAI o3-mini и Llama-405B от Meta.

Google уверяет, что Gemma 3 лучше других моделей / Фото Google

Gemma 3 поддерживает контекстное окно объемом 128 000 токенов, что эквивалентно полной 200-страничной книге. Для сравнения, контекстное окно модели Gemini 2.0 Flash Lite достигает 1 миллиона токенов.
Также модель поддерживает функциональные вызовы и структурированный вывод, что позволяет ей взаимодействовать с внешними базами данных и выполнять задачи в автоматизированном режиме, подобно тому, как Gemini работает с Gmail или Google Docs.
Gemma 3 можно развернуть как локально, так и через облачные платформы Google, в частности Vertex AI. Кроме того, она доступна через Google AI Studio, а также сторонние репозитории Hugging Face, Ollama и Kaggle.

Кстати, прошлом месяце Google выпустила Gemini 2․0 Flash Thinking. Новая модель получила способность "думать" и может открывать приложения, но их перечень пока сильно ограничен программами Google.

Возможности Gemma 3 – смотрите видео:

Google, как и Microsoft с ее серией открытых моделей Phi, активно развивает маломасштабные языковые модели (SLM) вместе с большими языковыми моделями (LLM). Маленькие AI-модели, такие как Gemma 3, обеспечивают эффективное использование ресурсов и низкую задержку, что делает их оптимальным решением для мобильных устройств.

Связанные темы:

Google

Техно

Искусственный интеллект