OpenAI представляет Агента ChatGPT, который выполняет задачи, используя ваш компьютер

Александр Гайдамашко

Основные тезисы

OpenAI представила ChatGPT Agent, универсального ИИ-агента, выполняющего задачи, управляя вашим компьютером.
Новый агент демонстрирует высокие результаты в тестах производительности и имеет встроенные меры безопасности для предотвращения злоупотреблений.
Доступ к ChatGPT Agent предоставляется пользователям ChatGPT Pro, а также подписчикам планов Plus, Team, Enterprise и Education с различными ограничениями.

Агент ChatGPT от OpenAI – новый ИИ-помощник выполняет задачи на компьютере

OpenAI выпустила мощного агента в ChatGPT / Unsplash

Компания OpenAI представила новую функцию для своего чат-бота ChatGPT Agent. Это универсальный ИИ-агент, который может самостоятельно выполнять разнообразные задачи на компьютере, превращая ChatGPT из инструмента для ответов в полноценного цифрового помощника.

Как работает ChatGPT Agent?

Новый инструмент, получивший название ChatGPT Agent, является самой смелой попыткой OpenAI превратить свой флагманский продукт в полноценного агента, который не просто отвечает на запросы, но и выполняет конкретные действия без вашего вмешательства. Он сочетает в себе возможности предыдущих разработок компании: Operator, который умел просматривать сайты и выполнять задачи, и Deep Research, специализирующийся на анализе больших объемов информации, пишет 24 Канал со ссылкой на TechCrunch.

Пользователи могут активировать нового помощника через меню инструментов в ChatGPT, выбрав "режим агента". После этого можно давать ему задания на обычном языке. Например, агент может самостоятельно просматривать сайты, нажимать на кнопки и ссылки, предлагать пользователю вход в учетную запись, выполнять анализ, генерировать презентации и электронные таблицы, работать с календарем и выполнять код.

Для выполнения задач агент использует собственный набор инструментов в виртуальной среде:

визуальный и текстовый браузеры;
терминал для выполнения кода;
прямой доступ к API;
коннекторы ChatGPT для подключения к сторонним приложениям, например Gmail или GitHub.

Во время работы агента пользователь видит на экране полное описание его действий и в любой момент может вмешаться в процесс, остановить его или взять управление на себя.

По данным OpenAI, новый агент демонстрирует превосходные результаты в тестах, измеряющих способность к вебпоиску и выполнению реальных задач:

Последний экзамен человечества: агент ChatGPT набирает новый проходной балл на уровне 44,4. Результат примерно вдвое лучше, чем у o3 и o4-mini от OpenAI. Это достаточно сложный тест, который предлагает тысячу вопросов по более чем ста предметам.
У FrontierMath, одном из самых сложных известных математических бенчмарков агент ChatGPT набирает 27,4%, когда имеет доступ к инструментам, таких как терминал для выполнения кода. Предыдущий современный балл получил o4-mini, который набрал лишь 6,3%.

Внутренний тест OpenAI, который оценивает производительность модели на сложных, экономически ценных задачах, связанных со знаниями: результаты агента ChatGPT сравнимы или лучше результатов людей примерно в половине случаев.

DSBench: агент ChatGPT значительно превосходит человеческую производительность в задачах по науке о данных.
SpreadsheetBench: агент ChatGPT набирает 45,5%, по сравнению с 20,0% у Copilot.

Демонстрация работы ChatGPT Agent: видео

Что по вопросам безопасности?

OpenAI отмечает, что разрабатывала агента ChatGPT с учетом безопасности, главным образом потому, что продукт имеет некоторые новые возможности, которые могут сделать его более опасным в руках злоумышленников. Компания ранее уже предупреждала, что агентные модели могут иметь более опасные возможности.

В отчете OpenAI отмечает, что определила эту модель как "высокофункциональную" в области биологического и химического оружия и способную "усилить существующие пути причинения серьезного вреда". OpenAI отмечает, что не имеет прямых доказательств этого, но решила принять меры предосторожности и активировать новые средства защиты для уменьшения этих рисков.

Новые меры безопасности для агента ChatGPT включают мониторинг, который работает в режиме реального времени во время взаимодействия пользователей с продуктом. OpenAI заявляет, что этот мониторинг запускает классификатор для каждого запроса, введенного в агента ChatGPT, определяя, связан ли запрос с опасностью. Если да, запускается второй монитор, который определяет, может ли содержимое запроса и ответа быть использовано для создания биологической угрозы.

OpenAI также заявляет, что отключила функцию памяти ChatGPT для этого агента, чтобы предотвратить злоупотребление. В других частях ChatGPT функция памяти OpenAI позволяет чат-боту ссылаться на информацию из предыдущих чатов пользователей. Однако OpenAI заявляет, что злоумышленники могут использовать эту функцию в агенте ChatGPT для похищения конфиденциальных данных с помощью атак с вводом запросов. Но компания не исключает, что когда-то вернет эту возможность, если найдет более безопасный способ ее использования.

Доступность

Новый инструмент уже доступен для пользователей ChatGPT Pro.
Подписчики планов Plus и Team получат к нему доступ в течение нескольких дней.
Пользователи тарифов Enterprise и Education – в ближайшие недели.
Для Pro-пользователей установлен лимит в 400 сообщений в месяц, для других платных планов – 40.
Дополнительное время работы с агентом можно будет приобрести отдельно.