Генеральний директор Alphabet Сундар Пічаї підкреслив швидкий темп інновацій компанії в епоху Gemini. Він був головним доповідачем, оголошуючи про найбільші новинки, які скоро стануть доступні користувачам. Частина з них – лише для платних підписників, але деякі будуть доступні всім, пише 24 Канал.
Дивіться також Найцікавіші оновлення, які Microsoft представила на конференції Build 2025
Штучний інтелект Gemini та його розвиток
Google активно розвиває Gemini, позиціонуючи його як майбутнього "універсального ШІ-асистента". Компанія прагне зробити додаток "особистим, проактивним і потужним". Застосунок уже має понад 400 мільйонів активних користувачів щомісяця. Google також активно розробляє агентний штучний інтелект, де "дослідження стає реальністю".
Нові моделі Gemini
- Gemini 2.5 Flash вийшов з попереднього перегляду, пропонуючи покращення продуктивності та ефективності. Він посідає друге місце після 2.5 Pro в таблиці лідерів LM Arena. Модель вже доступна в додатку Gemini і стане загальнодоступною для розробників у червні. У демонстрації було показано, що 2.5 Flash може говорити з кращою інтонацією.
- Gemini 2.5 Pro представлений як "найдосконаліша модель" від Google. Вона має розширені можливості міркування, покращені навички кодування та здатність створювати інтерактивні симуляції. Модель вже інтегрована в Android Studio.
- Gemini 2.5 Pro Deep Think – це новий режим "розширеного міркування". Google заявляє, що цей режим лідирує за бенчмарками з математики, коду та мультимодальності. Він дозволяє моделі розглядати кілька відповідей на запитання перед відповіддю, підвищуючи продуктивність. Ця функція проходить додаткові перевірки безпеки перед широким запуском і буде доступна передплатникам Google AI Ultra. Вона вже доступна "довіреним тестувальникам" через Gemini API.
- Gemini 2.5 Flash Lite буде доступний незабаром. Поки що деталей немає.
- Gemini Diffusion – це нова дослідницька модель, яка поєднує великі мовні моделі та дифузійні моделі. Вона може швидко ітерувати та коригувати рішення, генеруючи відповідь. Модель здатна видавати відповідь на складні математичні чи програмні запити значно швидше за типовий чат-бот, показуючи кроки для досягнення результату.
- Gemma 3n – модель, розроблена для плавної роботи на телефонах, ноутбуках і планшетах. Вона підтримує роботу з аудіо, текстом, зображеннями та відео і доступна для попереднього перегляду.
Нові рівні передплати Gemini
- План AI Premium перейменовано на Google AI Pro за тією ж ціною 19.99 долара на місяць. Він пропонує вищі ліміти порівняно з безкоштовним рівнем і буде поповнюватися новими функціями. Безкоштовний доступ до AI Pro на університетський навчальний рік запускається в Японії, Бразилії, Індонезії та Великій Британії. Передплатники AI Pro можуть протестувати бета-версію перекладу мов у Google Meet та отримати доступ до Flow.
- Оголошено про новий рівень Google AI Ultra за ціною 249.99 долара на місяць. Цей план надає ранній і максимальний доступ до передових технологій, забезпечуючи "найвищий рівень доступу". Передплата включає доступ до Veo 3, нового додатку для відеомонтажу Flow, додатка для реміксування зображень Whisk, вищих лімітів у NotebookLM, Gemini в Chrome, "агентних" інструментів на базі Project Mariner, YouTube Premium та 30 терабайтів сховища в Google Drive, Google Photos і Gmail. Також включено доступ до режиму Deep Think, Project Mariner і бета-версію перекладу мов у Meet. План пропонує необмежене використання функцій, які дорого коштують для Google, таких як Deep Research. Компанія пропонує новим передплатникам 50% знижки на перші три місяці AI Ultra. Вартість плану вже була названа "надмірно дорогою".
Нові можливості та функції Gemini
- Imagen 4 – модель для генерації зображень, яка має кращу деталізацію та текстові виходи. Вона вже впроваджується в додаток Gemini та з'явиться в екосистемі Workspace (Docs, Slides, Vids). Imagen 4 швидша за Imagen 3. Незабаром очікується варіант, який буде до 10 разів швидшим. Вона може відтворювати "тонкі деталі" (тканини, краплі води, хутро тварин), працювати з фотореалістичними та абстрактними стилями, створювати зображення в різних співвідношеннях сторін (можна буде вказати це в своєму запиті) та до 2K роздільної здатності.
- Veo 3 – модель для генерації неймовірно реалістичних відео з вбудованою генерацією звуку, включаючи діалоги, звукові ефекти та музику. Вона вже доступна в США для користувачів плану Ultra та покращує якість відео порівняно з Veo 2. Veo 3 та Imagen 4 використовуються для роботи Google Flow.
Приклад роботи моделі Veo 3: відео
Приклад роботи моделі Veo 3: відео
- Gemini Live – функція, що вже є на Android і скоро з'явиться в додатку Gemini для iOS. Вона дозволяє користувачам вести вербальні розмови з Gemini в реальному часі без потреби постійно натискати кнопку запису, одночасно передаючи відео з камери телефону або екрана моделі ШІ. Gemini Live працює із залученням іншої функції під назвою Project Astra, яка дозволяє ставити питання про скриншоти та живе відео з камери. Project Astra скоро надійде на обидві операційні системи. Найближчими тижнями очікується підтримка інтеграції з іншими додатками, такими як Calendar, Keep, Maps, Tasks. Також було показано, що Project Astra значно краще уникає "галюцинацій" і його складніше обдурити.
- У самому Project Astra продемонстровано останні можливості, включаючи керування телефоном на Android, навігацію додатками та здійснення дзвінків за голосовою командою користувача. Можливості Project Astra впроваджуються в додатки Google та різні форм-фактори, такі як XR-окуляри. Цей проєкт народився в Google DeepMind як демонстрація мультимодального ШІ майже в реальному часі, але не всі показані можливості будуть доступні зразу. Те, що показує компанія, є швидше баченням того, як усе це має працювати в ідеальному світі.
Демонстрація Project Astra: відео
Демонстрація Project Astra: відео
- Покращення в Deep Research дозволяє завантажувати власні PDF-файли та зображення для доповнення глибокого дослідження. Ця особиста інформація поєднується з загальнодоступними даними. Deep Research є ШІ-агентом, що генерує ґрунтовні дослідницькі звіти, а його використання необмежене для передплатників Ultra.
- Gemini Canvas – тепер те, що ви пишете, можна перетворити на вебсторінку, інфографіку, тест, аудіоогляд тощо.
- Gemini тепер може створювати інтерактивні тести.
- Project Mariner – експериментальний ШІ-агент Google, що може переглядати та використовувати вебсайти, керуючи вашим браузером на комп'ютері. Це аналог Operator від OpenAI, Nova Act від Amazon та Computer Use від Anthropic. Коли ми вперше про нього почули, цей ШІ називався "Джарвіс". Він доступний для передплатників Ultra. Project Mariner значно оновлено, дозволяючи агенту виконувати майже десяток завдань одночасно. Приклади включають пошук та купівлю квитків на події, бронювання столика в ресторані чи місцевої послуги за вашим дозволом. Функція "купити замість мене" при здійсненні покупок дозволяє додати товари до кошика та оформити замовлення за допомогою Google Pay. Користувачі можуть просто спілкуватися з ШІ-агентом Google, і він відвідуватиме вебсайти та виконуватиме дії замість них без необхідності відвідувати сторонні сайти. Mariner також працює в "Agent Mode" в додатку Gemini.
На жаль, нових демонстрацій Project Mariner нам не показали, але ви можете переглянути, як це працювало після першого анонсу майже пів року тому: відео
Оновлення Google Search
На I/O 2025 Google оголосив, що AI Mode, функції якого лягають в основу AI Overviews, тепер впроваджується для всіх користувачів у США. Варто зазначити, що "Огляд від ШІ" також уже доступний в Україні. Він автоматично вмикається для деяких запитів під час пошуку, щоб замість вас переглянути сайти і дати згенеровану відповідь на ваш запит.
Що стосується нових функцій, то вони спочатку запустяться в США, перш ніж перейти далі до інших користувачів. Обидва продукти незабаром використовуватимуть спеціальну версію Gemini 2.5.
- AI Mode зможе використовувати ваш "особистий контекст" з Gmail для "індивідуальних результатів", що відображають ваші вподобання. Це з'явиться цього літа.
- Режим також отримає можливість створювати діаграми та графіки для візуалізації спортивних та фінансових запитів.
- В AI Mode з'являться можливості для покупок з панеллю, яка оновлюється з відповідними продуктами в міру уточнення пошуку.
- Deep Search з'явиться в AI Mode. Це схоже на Deep Research в Gemini.
- Search Live використовуватиме можливості Project Astra для надання досвіду, схожого на Gemini Live. Це дозволить ставити запитання на основі того, що бачить камера вашого телефона в реальному часі. Він може зрозуміти запити (наприклад, про домашній науковий експеримент) і отримати відповіді з сайтів (Quora, YouTube). Доступ до нього буде через Google Lens та AI Mode.
- Агентні можливості Project Mariner також з'являться в AI Mode, дозволяючи виконувати такі запити, як пошук та купівля квитків чи бронювання.
- Функція "спробувати на собі" дозволить завантажити своє фото, щоб побачити, як одяг, знайдений у мережі, виглядатиме на вас, враховуючи, як матеріали складаються та розтягуються на різних типах фігур.
- AI Overviews тепер доступні у понад 200 країнах більш ніж 40 мовами. Google повідомив, що AI Overviews бачать понад 1.5 мільярда людей щомісяця і переважна більшість" людей взаємодіє з ними "значущим чином". Однак деякі користувачі воліли б просто отримати список посилань, тому існують способи "очистити" результати пошуку.
Оновлення Google Workspace
- Gmail отримає персоналізовані Smart Replies, які краще відповідатимуть вашому стилю написання, аналізуючи ваші електронні листи та документи на диску Drive. Також з'явиться функція Inbox Cleanup. Для цього потрібно буде надати Gemini дозвіл на доступ до особистої інформації. Передплатники зможуть використовувати персоналізовані відповіді цього літа.
- Google Meet отримає функцію перекладу мови в реальному часі, яка працює просто під час дзвінка. Вона доступна для тестування передплатникам ШІ Pro та Ultra вже сьогодні. Демонстрація показала, що Meet може відповідати тону та ритму мовця при перекладі з іспанської. Бета-версія для іспанської та англійської мов доступна цього тижня, а незабаром з'являться й інші мови.
Демонстрація функції перекладу в реальному часі: відео
- Google Docs дозволить "прив'язувати" відповіді бічної панелі Gemini до тексту. В додатки Workspace, включаючи Docs, Slides та Vids, прийде Imagen 4.
- Google Vids дозволить перетворити цілу презентацію на відео. Для ШІ-аватарів потрібен лише сценарій. З'являться функції Transcript Trim та Balance Sound, а також нові способи створення та редагування контенту.
Android та Wear OS
- Android 16 QPR1 Beta 1 розгортається з оновленим дизайном Material 3 Expressive. Також анонсовано нові способи пошуку втрачених телефонів та інших предметів, додаткові функції безпеки на рівні пристрою для програми Advanced Protection та інструменти захисту від шахрайства та крадіжок.
- Wear OS 6 Developer Preview доступний як емулятор з оновленими вказівками щодо дизайну Material 3 Expressive. Wear OS 6 впроваджує уніфікований шрифт для плиток, а Pixel Watches отримають динамічні теми, що синхронізують кольори додатків з циферблатами. Google випускає посібник з дизайну та файли Figma для розробників.
Android XR
Google все більше заглиблюється в доповнену реальність з Android XR – своєю операційною системою, створеною спеціально для AR-окулярів та VR-гарнітур. Хоча компанія зараз лише наздоганяє Meta та Apple у цих просторах, на I/O 2025 було показано більше демо. Демонстрації показали можливості Project Astra, такі як проєктування вказівників навігації Google Maps безпосередньо на окуляри або запам'ятовування об'єктів в оточенні. Android XR дозволить бачити голографічний вигляд Карт, встановлювати події календаря без використання екрана. Функція використовує Gemini для голосових команд та інструкцій.
Google співпрацює з партнерами, включаючи Samsung (з яким розширено партнерство), Xreal, Warby Parker та Gentle Monster, для створення нових пристроїв.
- Xreal працює над Project Aura – другою офіційною гарнітурою на Android XR, яка буде підключеними смарт-окулярами.
- Google співпрацює з Samsung над її гарнітурою Project Moohan, яка очікується пізніше цього року.
- Нарешті, компанія розробляє свій власний продукт, сподіваючись на краще сприйняття, ніж у Google Glass, потенційно використовуючи інтеграцію з пристроями Pixel.
Також продемонстровано функцію перекладу в реальному часі для Android XR за допомогою прототипу смарт-окулярів, створеного спільно з Samsung.
Google Chrome
Нарешті, через цілу купу часу Google інтегрує Gemini в Chrome. Хоча це далеко не те, чого ви могли очікувати, все ж це перший крок до розширення функцій браузера за допомогою функцій ШІ. Раніше єдиною ШІ-функцією була можливість генерувати теми оформлення. Тепер додасться аналог Gemini Live для живих розмов із браузером.
На момент запуску основна увага буде приділена можливості ставити запитання про поточну сторінку, а навігація по вебсайтах з'явиться пізніше цього року. Доступ до Gemini буде через іконку у верхній частині браузера та через нове меню. Gemini в Chrome включено до передплати Ultra. Чи буде це згодом для безплатних користувачів, невідомо.
Як працюватиме Gemini в Chrome: відео
Менеджер паролів Chrome також отримує оновлення: він зможе автоматично змінювати паролі для облікових записів, які були скомпрометовані внаслідок витоків даних. Якщо Google виявить витік, менеджер паролів дозволить згенерувати новий пароль та оновити сумісний обліковий запис одним кліком. Ця функція працює лише з вебсайтами, що беруть участь у програмі. Google співпрацює з розробниками для додавання підтримки.
Інші анонси ШІ та технології
- Project Starline тепер називається Google Beam. Це "перша 3D-платформа для відеозв'язку на основі ШІ". HP виробляє перший пристрій. Технологія використовує комплексне обладнання та ПЗ для створення 3D-візуалізації співрозмовника, створюючи враження присутності. Вона включає переклад у реальному часі при використанні з Google Meet. Google починає продавати цю технологію бізнес-клієнтам.
Project Starline / Фото Google
- Google Flow – це "інструмент для створення фільмів на основі ШІ", побудований на моделях Veo, Imagen та Gemini. Це еволюція VideoFX, що дозволяє використовувати запити природною мовою, керувати камерою та створювати сцени. Flow доступний передплатникам Google ШІ Pro та Ultra в США вже сьогодні.
- SynthID Detector – це "портал верифікації", що допомагає ідентифікувати ШІ-генерований контент. Ви завантажуєте контент, і Google повідомляє, чи є в ньому водяний знак SynthID повністю або частково. SynthID додає невидимий водяний знак до ШІ-медіа. Google співпрацює з Nvidia та GetReal для впровадження цієї технології. Ранні тестувальники отримали доступ відразу після презентації з обіцянкою на ширший доступ пізніше.
- У NotebookLM з'являться Video Overviews (відеоогляди на додачу до вже доступних аудіооглядів).
- Whisk – додаток для реміксування зображень, що дозволяє створювати зображення з тексту.
Анонси для розробників
- Jules – це "справжній агент для кодування", який "читає ваш код, розуміє ваш намір і береться до роботи" у фоновому режимі. Зокрема, Jules може писати тести, створювати нові функції, виправляти помилки та оновлювати версії залежностей. Він доступний у публічній бета-версії без списку очікування по всьому світу. Jules також допомагає розробникам зрозуміти складний код, створювати pull requests на GitHub та обробляти певні завдання з беклогу.
- Android Studio отримав інтеграцію Gemini, що тепер працює на базі 2.5 Pro. Google спрощує тестування функцій ШІ у стабільному каналі за допомогою Studio Labs. Android Studio включає нові функції ШІ, такі як "Journeys" (агентна можливість ШІ, що збігається з випуском Gemini 2.5 Pro) та "Agent Mode", що може обробляти складніші процеси розробки. Покращена функція "crash insights" (у панелі App Quality Insights) на базі Gemini аналізуватиме вихідний код додатка, щоб ідентифікувати потенційні причини збоїв та пропонувати виправлення.
- У Google Play розробники додатків тепер можуть "зупиняти повністю активні релізи", якщо виникла проблема. Оновлення не буде пропонуватися користувачам, які його ще не встановили. Google активно працює над "насиченим контентом" Play Store з кураторськими просторами, що відзначають сезонні та постійні інтереси. Очікується більше категорій та локацій цього року. Нові сторінки перегляду тем представлятимуть актуальний, релевантний та візуально привабливий контент (живий спорт, фільми, шоу). Колекції Google Play додають нову категорію "Подорожі" і з'являться в Бразилії, Індії, Індонезії, Японії та Мексиці. Контент звідти також з'явиться в Play Store. Інструменти управління підписками оновлюються з багатопродуктовим оформленням замовлення, дозволяючи пропонувати додаткові підписки разом з основними в рамках одного платежу.