Imagen 4 способен работать как в фотореалистичном, так и в художественно-абстрактном стилях, объясняет 24 Канал. Он поддерживает различные пропорции кадра и может генерировать изображения в разрешении до 2K.
Смотрите также Gemini получит Agent Mode: ИИ самостоятельно будет выполнять задачи вместо вас
Особое внимание команда разработчиков уделила корректному отображению текста и типографики – важное преимущество для тех, кто создает презентации, приглашения, рекламные макеты или другие материалы, где сочетаются изображения и слова.
Сгенерированный в Imagen 4 постер / Фото Google
Джош Вудвард, руководитель подразделения Google Labs, отметил, что Imagen 4 – это "большой шаг вперед в плане качества". По его словам, компания также устранила типичные ошибки предыдущих версий, в частности те, касающиеся искаженного текста, некорректного шрифта или логотипов.
На фоне конкуренции со стороны таких сервисов, как Midjourney V7, OpenAI с DALL-E или Adobe Firefly, новая модель от Google отличается еще и скоростью. Imagen 4 уже работает быстрее своего предшественника, а вскоре появится еще одна модификация, которая будет в 10 раз быстрее Imagen 3.
Imagen 4 генерирует изображения с новым уровнем детализации / Фото Google
Сейчас Imagen 4 уже доступен в приложении Gemini, платформах Whisk и Vertex AI, а также в продуктах Google Workspace – таких как Слайды, Документы, Vids и другие.
Потенциал применения
Imagen 4 может стать полезным инструментом не только для дизайнеров или маркетологов. Благодаря улучшенному рендерингу текста, его удобно использовать в сфере образования – для создания визуализированных материалов, постеров или интерактивных учебных слайдов.
На Google I/O 2025 компания также представила Flow – новый инструмент для создания видео с помощью ИИ. Он использует текстовые запросы и даже изображения в виде скетчей.