Как OpenAI планирует изменить наше взаимодействие с интернетом?

Недавно в составе ChatGPT запустили так называемый Agent mode – режим агента, который позволяет искусственному интеллекту самостоятельно работать в сети, выполняя многослойные и сложные задачи без вмешательства человека. Эта функция использует виртуальную машину на базе Linux, работающую в облачной среде Azure. Агент может просматривать сайты, скролить, нажимать на ссылки и кнопки и заполнять формы, работая в виртуальном браузере в рамках ChatGPT. Однако его способности ограничены: он фактически заперт в своеобразной клетке Фарадея, не имея возможности контролировать ваш реальный браузер, видеть открытые вкладки или взаимодействовать с другими элементами интерфейса операционной системы, пишет 24 Канал со ссылкой на сообщение Тибора Благо, компьютерного инженера из ИИ-стартапа AIPRM.

К теме OpenAI готовится запустить ИИ-браузер для конкуренции с Google Chrome

Новая утечка, обнаруженная в коде OpenAI, свидетельствует, что компания планирует устранить эти ограничения. Разработчики создают механизм, который позволит "Агенту" выбирать между двумя путями выполнения задач: текущим удаленным "облачным браузером" и новым локальным браузером, разработанным самой OpenAI. Этот браузер будет создан на основе открытой технологии Chromium, лежащей в основе таких популярных обозревателей, как Google Chrome и Microsoft Edge.

Это означает, что ИИ-агент получит прямой контроль над браузером пользователя. В коде было найдено скрытый переключатель "Use cloud browser" (Использовать облачный браузер), а также специальный шлюз, который проверяет, запущен ли ChatGPT в фирменном приложении OpenAI.

Такой шаг является логическим продолжением стратегии OpenAI по построению так называемого "агентского будущего", где искусственный интеллект выступает не просто как инструмент, а как полноценный помощник, автономно выполняющий сложные многоэтапные задачи. Интеграция ИИ-агента непосредственно в браузер открывает огромные возможности: от автоматического бронирования билетов и отелей по одному запросу до проведения комплексного исследования в интернете и подготовки отчетов.

Информация о разработке собственного браузера OpenAI впервые появилась в июле. Уже тогда было очевидно, что нас ждет именно такой подход, где агент управляет всем браузером, поскольку это предлагают ближайшие конкуренты, которые также разрабатывают ИИ-браузеры, в частности The Browser Company с ее Dia, а также Perplexity с его технологией Comet, которая уже выходит из этапа тестирования. Поэтому эта утечка просто подтвердила то, что мы и так уже знали.

Создание браузера на базе Chromium является разумным шагом, поскольку это обеспечит совместимость с миллионами сайтов и существующими расширениями, что упростит переход для пользователей. Выпуск такого продукта может серьезно повлиять на рынок браузеров, бросив вызов доминированию Google. Наконец, для самой OpenAI это станет огромным плюсом, ведь позволит удерживать пользователей внутри экосистемы ChatGPT.