Как это будет работать
Сначала Operator поступит для первого тестирования пользователям, которые купили подписку на ChatGPT за 200 долларов. OpenAI заявляет, что со временем планирует развернуть эту функцию для большего количества пользователей уровней Plus, Team и Enterprise. Но бесплатной она, судя по всему, не станет, сообщает 24 Канал со ссылкой на Neowin.
Смотрите также Google обновила Gemini: искусственный интеллект теперь получил многозадачность
Сейчас Operator доступен только на отдельном сайте, но вскоре его интегрируют в основной сервис ChatGPT. Сэм Альтман, глава компании OpenAI говорит, что новая функция будет доступна во всем мире, но распространение на Европу займет некоторое время, чтобы согласовать все с местными строгими законами по конфиденциальности.
Operator обещает автоматизировать такие задачи, как бронирование жилья для путешествий, бронирование столиков в ресторанах и совершение покупок в интернете. В интерфейсе есть несколько категорий задач, среди которых пользователи могут выбирать, включая покупки, доставку, рестораны и путешествия — все они позволяют осуществлять различные виды автоматизации.
Когда пользователи ChatGPT активируют функцию, появляется небольшое окно, показывающее специальный браузер, который агент использует для выполнения задач, вместе с объяснениями конкретных действий, которые он выполняет в конкретный момент. Пользователи все еще смогут контролировать свой экран во время работы Operator.
Суть его работы в том, что вы можете дать ему задание естественным языком, и он выполнит за вас всю последовательность действий. Например, вам нужно подготовить вечеринку. Дайте ему задание, в котором укажите нужные товары, количество гостей, тематику вечеринки и запустите. Он сам зайдет в нужные интернет-магазины, введет необходимые товары в поиск, осмотрит лучшие, добавит в корзину. Вам останется только подтвердить операцию в конце.
Модель CUA обучена запрашивать подтверждение пользователя перед завершением задач. Например, перед отправкой заказа, отправкой электронного письма и т.д., чтобы пользователь мог проверить работу модели,
– пишет OpenAI.
Что в основе
OpenAI утверждает, что Operator работает на основе модели Computer-Using Agent, или CUA, которая сочетает возможности зрения модели GPT-4o компании с возможностями рассуждения более продвинутых моделей OpenAI. CUA обучен взаимодействовать с интерфейсом сайтов, а это означает, что ему не нужно использовать API, ориентированные на разработчика, для доступа к различным сервисам.
Другими словами, CUA может использовать кнопки, перемещаться по меню и заполнять формы на странице так же, как это делает человек.
OpenAI заявляет, что сотрудничает с такими компаниями, как DoorDash, eBay, Instacart, Priceline, StubHub и Uber, чтобы гарантировать, что Operator соблюдает правила пользования услугами этих компаний. Но компания говорит, что "пока не ожидает, что CUA будет надежно работать во всех сценариях".
Сейчас Operator не может надежно обрабатывать много сложных или специализированных задач, таких как создание детальных слайд-шоу, управление сложными календарными системами или взаимодействие с высококастомизированными или нестандартными интерфейсами,
– добавляет OpenAI в документе поддержки.
Из соображений предосторожности, OpenAI также требует надзора за некоторыми задачами, такими как электронная почта или банковские транзакции. Например, пользователи должны будут самостоятельно вводить информацию о банковской карте. Operator требует активного надзора пользователя, что гарантирует, что пользователи могут непосредственно отслеживать и исправлять любые потенциальные ошибки, которые может допустить модель. OpenAI утверждает, что Operator не собирает и не делает скриншотов никаких данных.
Хотя это все и ограничивает полезность Operator, но также гарантирует, что агент не начнёт галлюцинировать и, скажем, не потратит весь ваш кредитный лимит на какой-то хлам с Temu. Google применил похожий подход к своему ИИ-агенту Project Mariner, который также не заполняет информацию, например, номера кредитных карточек.
Смотрите демонстрацию работы новой функции: видео