Генеральный директор Alphabet Сундар Пичаи подчеркнул быстрый темп инноваций компании в эпоху Gemini. Он был главным докладчиком, объявляя о крупнейших новинках, которые скоро станут доступны пользователям. Часть из них – только для платных подписчиков, но некоторые будут доступны всем, пишет 24 Канал.

Смотрите также Самые интересные обновления, которые Microsoft представила на конференции Build 2025

Искусственный интеллект Gemini и его развитие

Google активно развивает Gemini, позиционируя его как будущего "универсального ИИ-ассистента". Компания стремится сделать приложение "личным, проактивным и мощным". Приложение уже имеет более 400 миллионов активных пользователей ежемесячно. Google также активно разрабатывает агентный искусственный интеллект, где "исследование становится реальностью".

Новые модели Gemini

  • Gemini 2.5 Flash вышел из предварительного просмотра, предлагая улучшение производительности и эффективности. Он занимает второе место после 2.5 Pro в таблице лидеров LM Arena. Модель уже доступна в приложении Gemini и станет общедоступной для разработчиков в июне. В демонстрации было показано, что 2.5 Flash может говорить с лучшей интонацией.
  • Gemini 2.5 Pro представлен как "самая совершенная модель" от Google. Она имеет расширенные возможности рассуждения, улучшенные навыки кодирования и способность создавать интерактивные симуляции. Модель уже интегрирована в Android Studio.
  • Gemini 2.5 Pro Deep Think – это новый режим "расширенного рассуждения". Google заявляет, что этот режим лидирует по бенчмаркам по математике, кода и мультимодальности. Он позволяет модели рассматривать несколько ответов на вопрос перед ответом, повышая производительность. Эта функция проходит дополнительные проверки безопасности перед широким запуском и будет доступна подписчикам Google AI Ultra. Она уже доступна "доверенным тестировщикам" через Gemini API.
  • Gemini 2.5 Flash Lite будет доступен в скором времени. Пока что деталей нет.
  • Gemini Diffusion – это новая исследовательская модель, которая сочетает большие языковые модели и диффузионные модели. Она может быстро итерировать и корректировать решение, генерируя ответ. Модель способна выдавать ответ на сложные математические или программные запросы значительно быстрее типичного чат-бота, показывая шаги для достижения результата.
  • Gemma 3n – модель, разработана для плавной работы на телефонах, ноутбуках и планшетах. Она поддерживает работу с аудио, текстом, изображениями и видео и доступна для предварительного просмотра.

Новые уровни подписки Gemini

  • План AI Premium переименован в Google AI Pro по той же цене 19.99 доллара в месяц. Он предлагает более высокие лимиты по сравнению с бесплатным уровнем и будет пополняться новыми функциями. Бесплатный доступ к AI Pro на университетский учебный год запускается в Японии, Бразилии, Индонезии и Великобритании. Подписчики AI Pro могут протестировать бета-версию перевода языков в Google Meet и получить доступ к Flow.
  • Объявлено о новом уровне Google AI Ultra по цене 249.99 доллара в месяц. Этот план предоставляет ранний и максимальный доступ к передовым технологиям, обеспечивая "самый высокий уровень доступа". Подписка включает доступ к Veo 3, новому приложению для видеомонтажа Flow, приложению для ремикширования изображений Whisk, высших лимитов в NotebookLM, Gemini в Chrome, "агентских" инструментов на базе Project Mariner, YouTube Premium и 30 терабайт хранилища в Google Drive, Google Photos и Gmail. Также включен доступ к режиму Deep Think, Project Mariner и бета-версию перевода языков в Meet. План предлагает неограниченное использование функций, которые дорого стоят для Google, таких как Deep Research. Компания предлагает новым подписчикам 50% скидки на первые три месяца AI Ultra. Стоимость плана уже была названа "чрезмерно дорогой".

Новые возможности и функции Gemini

  • Imagen 4 – модель для генерации изображений, которая имеет лучшую детализацию и текстовые выходы. Она уже внедряется в приложение Gemini и появится в экосистеме Workspace (Docs, Slides, Vids). Imagen 4 быстрее Imagen 3. Вскоре ожидается вариант, который будет до 10 раз быстрее. Она может воспроизводить "тонкие детали" (ткани, капли воды, мех животных), работать с фотореалистичными и абстрактными стилями, создавать изображения в различных соотношениях сторон (можно будет указать это в своем запросе) и до 2K разрешения.
  • Veo 3 – модель для генерации невероятно реалистичных видео со встроенной генерацией звука, включая диалоги, звуковые эффекты и музыку. Она уже доступна в США для пользователей плана Ultra и улучшает качество видео по сравнению с Veo 2. Veo 3 и Imagen 4 используются для работы Google Flow.

Пример работы модели Veo 3: видео

Пример работы модели Veo 3: видео

  • Gemini Live – функция, уже есть на Android и скоро появится в приложении Gemini для iOS. Она позволяет пользователям вести вербальные разговоры с Gemini в реальном времени без необходимости постоянно нажимать кнопку записи, одновременно передавая видео с камеры телефона или экрана модели ИИ. Gemini Live работает с привлечением другой функции под названием Project Astra, которая позволяет задавать вопросы о скриншотах и живом видео с камеры. Project Astra скоро поступит на обе операционные системы. В ближайшие недели ожидается поддержка интеграции с другими приложениями, такими как Calendar, Keep, Maps, Tasks. Также было показано, что Project Astra значительно лучше избегает "галлюцинаций" и его сложнее обмануть.
  • В самом Project Astra продемонстрированы последние возможности, включая управление телефоном на Android, навигацию приложениями и осуществление звонков по голосовой команде пользователя. Возможности Project Astra внедряются в приложения Google и различные форм-факторы, такие как XR-очки. Этот проект родился в Google DeepMind как демонстрация мультимодального ИИ почти в реальном времени, но не все показанные возможности будут доступны сразу. То, что показывает компания, является скорее видением того, как все это должно работать в идеальном мире.

Демонстрация Project Astra: видео

Демонстрация Project Astra: видео

  • Улучшения в Deep Research позволяет загружать собственные PDF-файлы и изображения для дополнения глубокого исследования. Эта личная информация объединяется с общедоступными данными. Deep Research является ИИ-агентом, генерирующим основательные исследовательские отчеты, а его использование неограниченно для подписчиков Ultra.
  • Gemini Canvas – теперь то, что вы пишете, можно превратить в веб-страницу, инфографику, тест, аудиообзор и тому подобное.
  • Gemini теперь может создавать интерактивные тесты.
  • Project Mariner – экспериментальный ИИ-агент Google, что может просматривать и использовать веб-сайты, управляя вашим браузером на компьютере. Это аналог Operator от OpenAI, Nova Act от Amazon и Computer Use от Anthropic. Когда мы впервые о нем услышали, этот ИИ назывался "Джарвис". Он доступен для подписчиков Ultra. Project Mariner значительно обновлен, позволяя агенту выполнять почти десяток задач одновременно. Примеры включают поиск и покупку билетов на события, бронирование столика в ресторане или местной услуги по вашему разрешению. Функция "купить вместо меня" при совершении покупок позволяет добавить товары в корзину и оформить заказ с помощью Google Pay. Пользователи могут просто общаться с ИИ-агентом Google, и он будет посещать веб-сайты и выполнять действия вместо них без необходимости посещать сторонние сайты. Mariner также работает в "Agent Mode" в приложении Gemini.

К сожалению, новых демонстраций Project Mariner нам не показали, но вы можете посмотреть, как это работало после первого анонса почти полгода назад: видео

Обновление Google Search

На I/O 2025 Google объявил, что AI Mode, функции которого ложатся в основу AI Overviews, теперь внедряется для всех пользователей в США. Стоит отметить, что "Обзор от ИИ" также уже доступен в Украине. Он автоматически включается для некоторых запросов во время поиска, чтобы вместо вас просмотреть сайты и дать сгенерированный ответ на ваш запрос.

Что касается новых функций, то они сначала запустятся в США, прежде чем перейти дальше к другим пользователям. Оба продукта вскоре будут использовать специальную версию Gemini 2.5.

  • AI Mode сможет использовать ваш "личный контекст" из Gmail для "индивидуальных результатов", отражающих ваши предпочтения. Это появится этим летом.
  • Режим также получит возможность создавать диаграммы и графики для визуализации спортивных и финансовых запросов.
  • В AI Mode появятся возможности для покупок с панелью, которая обновляется с соответствующими продуктами по мере уточнения поиска.
  • Deep Search появится в AI Mode. Это похоже на Deep Research в Gemini.
  • Search Live будет использовать возможности Project Astra для предоставления опыта, похожего на Gemini Live. Это позволит задавать вопросы на основе того, что видит камера вашего телефона в реальном времени. Он может понять запросы (например, о домашнем научном эксперименте) и получить ответы с сайтов (Quora, YouTube). Доступ к нему будет через Google Lens и AI Mode.
  • Агентские возможности Project Mariner также появятся в AI Mode, позволяя выполнять такие запросы, как поиск и покупка билетов или бронирование.
  • Функция "попробовать на себе" позволит загрузить свое фото, чтобы увидеть, как одежда, найденная в сети, будет выглядеть на вас, учитывая, как материалы складываются и растягиваются на разных типах фигур.
  • AI Overviews теперь доступны в более чем 200 странах на более чем 40 языках. Google сообщил, что AI Overviews видят более 1.5 миллиарда человек ежемесячно и подавляющее большинство" людей взаимодействует с ними "значимым образом". Однако некоторые пользователи предпочли бы просто получить список ссылок, поэтому существуют способы "очистить" результаты поиска.

Обновление Google Workspace

  • Gmail получит персонализированные Smart Replies, которые будут лучше соответствовать вашему стилю написания, анализируя ваши электронные письма и документы на диске Drive. Также появится функция Inbox Cleanup. Для этого нужно будет предоставить Gemini разрешение на доступ к личной информации. Подписчики смогут использовать персонализированные ответы этим летом.
  • Google Meet получит функцию перевода речи в реальном времени, которая работает прямо во время звонка. Она доступна для тестирования подписчикам ИИ Pro и Ultra уже сегодня. Демонстрация показала, что Meet может соответствовать тону и ритму говорящего при переводе с испанского. Бета-версия для испанского и английского языков доступна на этой неделе, а вскоре появятся и другие языки.

Демонстрация функции перевода в реальном времени: видео

  • Google Docs позволит "привязывать" ответы боковой панели Gemini к тексту. В приложения Workspace, включая Docs, Slides и Vids, придет Imagen 4.
  • Google Vids позволит превратить целую презентацию в видео. Для ИИ-аватаров нужен только сценарий. Появятся функции Transcript Trim и Balance Sound, а также новые способы создания и редактирования контента.

Android и Wear OS

  • Android 16 QPR1 Beta 1 разворачивается с обновленным дизайном Material 3 Expressive. Также анонсированы новые способы поиска потерянных телефонов и других предметов, дополнительные функции безопасности на уровне устройства для программы Advanced Protection и инструменты защиты от мошенничества и краж.
  • Wear OS 6 Developer Preview доступен как эмулятор с обновленными указаниями по дизайну Material 3 Expressive. Wear OS 6 внедряет унифицированный шрифт для плиток, а Pixel Watches получат динамические темы, синхронизирующие цвета приложений с циферблатами. Google выпускает руководство по дизайну и файлы Figma для разработчиков.

Android XR

Google все больше углубляется в дополненную реальность с Android XR – своей операционной системой, созданной специально для AR-очков и VR-гарнитур. Хотя компания сейчас только догоняет Meta и Apple в этих пространствах, на I/O 2025 было показано больше демо. Демонстрации показали возможности Project Astra, такие как проектирование указателей навигации Google Maps непосредственно на очки или запоминание объектов в окружении. Android XR позволит видеть голографический вид Карт, устанавливать события календаря без использования экрана. Функция использует Gemini для голосовых команд и инструкций.

Google сотрудничает с партнерами, включая Samsung (с которым расширено партнерство), Xreal, Warby Parker и Gentle Monster, для создания новых устройств.

  • Xreal работает над Project Aura – второй официальной гарнитурой на Android XR, которая будет подключенными смарт-очками.
  • Google сотрудничает с Samsung над ее гарнитурой Project Moohan, которая ожидается позже в этом году.
  • Наконец, компания разрабатывает свой собственный продукт, надеясь на лучшее восприятие, чем у Google Glass, потенциально используя интеграцию с устройствами Pixel.

Также продемонстрирована функция перевода в реальном времени для Android XR с помощью прототипа смарт-очков, созданного совместно с Samsung.

Google Chrome

Наконец, спустя целую кучу времени Google интегрирует Gemini в Chrome. Хотя это далеко не то, чего вы могли ожидать, все же это первый шаг к расширению функций браузера с помощью функций ИИ. Ранее единственной ИИ-функцией была возможность генерировать темы оформления. Теперь добавится аналог Gemini Live для живых разговоров с браузером.

На момент запуска основное внимание будет уделено возможности задавать вопросы о текущей странице, а навигация по вебсайтам появится позже в этом году. Доступ к Gemini будет через иконку в верхней части браузера и через новое меню. Gemini в Chrome включена в подписку Ultra. Будет ли это впоследствии для бесплатных пользователей, неизвестно.

Как будет работать Gemini в Chrome: видео

Менеджер паролей Chrome также получает обновление: он сможет автоматически менять пароли для учетных записей, которые были скомпрометированы в результате утечек данных. Если Google обнаружит утечку, менеджер паролей позволит сгенерировать новый пароль и обновить совместимый аккаунт одним кликом. Эта функция работает только с веб-сайтами, участвующих в программе. Google сотрудничает с разработчиками для добавления поддержки.

Другие анонсы ИИ и технологии

  • Project Starline теперь называется Google Beam. Это "первая 3D-платформа для видеосвязи на основе ИИ". HP производит первое устройство. Технология использует комплексное оборудование и ПО для создания 3D-визуализации собеседника, создавая впечатление присутствия. Она включает перевод в реальном времени при использовании с Google Meet. Google начинает продавать эту технологию бизнес-клиентам.

Project Starline
Project Starline / Фото Google

  • Google Flow – это "инструмент для создания фильмов на основе ИИ", построен на моделях Veo, Imagen и Gemini. Это эволюция VideoFX, что позволяет использовать запросы на естественном языке, управлять камерой и создавать сцены. Flow доступен подписчикам Google ИИ Pro и Ultra в США уже сегодня.
  • SynthID Detector – это "портал верификации", что помогает идентифицировать ИИ-генерированный контент. Вы загружаете контент, и Google сообщает, есть ли в нем водяной знак SynthID полностью или частично. SynthID добавляет невидимый водяной знак к ИИ-медиа. Google сотрудничает с Nvidia и GetReal для внедрения этой технологии. Ранние тестировщики получили доступ сразу после презентации с обещанием на более широкий доступ позже.
  • В NotebookLM появятся Video Overviews (видеообзоры в дополнение к уже доступным аудиообзорам).
  • Whisk – приложение для ремикширования изображений, позволяющее создавать изображения из текста.

Анонсы для разработчиков

  • Jules – это "настоящий агент для кодирования", который "читает ваш код, понимает ваше намерение и приступает к работе" в фоновом режиме. В частности, Jules может писать тесты, создавать новые функции, исправлять ошибки и обновлять версии зависимостей. Он доступен в публичной бета-версии без списка ожидания по всему миру. Jules также помогает разработчикам понять сложный код, создавать pull requests на GitHub и обрабатывать определенные задачи из бэклогов.
  • Android Studio получил интеграцию Gemini, что теперь работает на базе 2.5 Pro. Google упрощает тестирование функций ИИ в стабильном канале с помощью Studio Labs. Android Studio включает новые функции ИИ, такие как "Journeys" (агентная возможность ИИ, что совпадает с выпуском Gemini 2.5 Pro) и "Agent Mode", что может обрабатывать сложные процессы разработки. Улучшенная функция "crash insights" (в панели App Quality Insights) на базе Gemini будет анализировать исходный код приложения, чтобы идентифицировать потенциальные причины сбоев и предлагать исправления.
  • В Google Play разработчики приложений теперь могут "останавливать полностью активные релизы", если возникла проблема. Обновление не будет предлагаться пользователям, которые его еще не установили. Google активно работает над "насыщенным контентом" Play Store с кураторскими пространствами, отмечающими сезонные и постоянные интересы. Ожидается больше категорий и локаций в этом году. Новые страницы просмотра тем будут представлять актуальный, релевантный и визуально привлекательный контент (живой спорт, фильмы, шоу). Коллекции Google Play добавляют новую категорию "Путешествия" и появятся в Бразилии, Индии, Индонезии, Японии и Мексике. Контент оттуда также появится в Play Store. Инструменты управления подписками обновляются с многопродуктовым оформлением заказа, позволяя предлагать дополнительные подписки вместе с основными в рамках одного платежа.