Третья фаза ИИ: что такое агенты искусственного интеллекта, как они работают и как изменят жизнь
- ИИ-агенты могут выполнять сложные задачи без постоянного надзора человека, но создают новые риски для рабочих мест и безопасности.
- Разработчики, такие как OpenAI, Microsoft и Google, уже внедряют такие агенты, но подчеркивают необходимость человеческого надзора из-за потенциальных рисков.
- Примеры применения включают автоматизацию бизнес-процессов и программирование, но есть случаи неудач из-за ошибок агентов.
Эпоха обычных чат-ботов уходит, им на смену приходят ИИ-агенты, способные работать самостоятельно и выполнять сложные задачи без постоянного присмотра человека. Эти системы уже умеют покупать недвижимость, искать билеты в кино и ресторан, писать код и даже управлять бизнесом. В то же время эти технологии создают новые риски для рабочих мест и безопасности.
Что такое ИИ-агенты и в чем их преимущество?
Развитие генеративного искусственного интеллекта сейчас прошло три основных этапа. Сначала появились чат-боты вроде ChatGPT, которые революционизировали общение с машинами в ноябре 2022 года. Затем наступила эра ИИ-ассистентов, построенных на тех же языковых моделях, но предназначенных для выполнения конкретных задач под наблюдением людей. Теперь наступает третья фаза – ИИ-агенты, пишет 24 Канал.
Смотрите также Microsoft Edge превратится в полноценный агентский ИИ-браузер
В отличие от предшественников, агенты предназначены для достижения комплексных целей, а не выполнения отдельных задач, как об этом говорят сами разработчики. Но в чем же разница? Эти системы имеют развитые возможности рассуждения и памяти, могут работать в командах и использовать различные программные инструменты – от веб-браузеров до систем оплаты. Самым ярким примером стала новая версия ChatGPT Агента от OpenAI, которая объединяет два продукта (Operator и Deep Research) в единую мощную систему, что, по словам разработчиков, "думает и действует".
Бум разработки агентов начался в прошлом году. Важной вехой стал октябрь, когда Anthropic предоставила своему чат-боту Claude способность взаимодействовать с компьютером так же, как это делает человек. Все что вам нужно сделать – это дать программе какое-то задание, а потом просто наблюдать за работой. Агент начинает серфить в интернете, вводить в браузер поисковые запросы, искать и обрабатывать для вас информацию в различных источниках, нажимать на кнопки и ссылки, заполнять онлайн-формы и прочее.
Например, вы можете попросить купить необходимые вещи для вечеринки. Функция Computer use в составе Claude сама проанализирует, что именно вам может быть нужно (или предоставьте собственный список), затем зайдет в интернет-магазин, осуществит поиск, проанализирует характеристики и цены и добавит все товары в корзину. Вам остается только подтвердить оплату.
Функция Computer use для автоматизации операций: видео
Функция Computer use для выполнения поиска в интернете: видео
- Другие разработчики быстро подхватили тренд. OpenAI выпустила веб-агента Operator, Microsoft анонсировала Агентов Copilot, а Google и Meta запустили собственные решения – Vertex AI и Llama Агенты соответственно.
- Китайские стартапы также не остались в стороне. Компания Monica продемонстрировала свой Manus AI Агент, который покупал недвижимость и превращал записи лекций в сжатые конспекты. Другой стартап Genspark создал поискового агента, выдающего одностраничные обзоры со ссылками на полезные задачи.
- Специализированные агенты показывают особенно впечатляющие результаты. В сфере программирования лидируют Microsoft Copilot и OpenAI Codex – они самостоятельно пишут, оценивают и добавляют код, а также проверяют человеческий код на ошибки.
- Но и Claude не сильно отстает. Его функции кодирования настолько хороши и популярны, что компания объявила о внедрении лимитов на запросы, причем делает она это даже в платных версиях, поскольку серверы просто не справляются.
- Для научных исследований Google разработала ИИ "со-соученого" (AI co-scientist) – сложную мультиагентную систему, предназначенную для генерации новых идей и исследовательских предложений.
- OpenAI Deep Research выполняет комплексные задачи через многоэтапные онлайн-исследования.
Практическое применение уже началось. В 2024 году телекоммуникационная компания Telstra массово внедрила подписки на Microsoft Copilot. По данным компании, ИИ-генерированные резюме встреч и черновики контента экономят сотрудникам в среднем 1-2 часа в неделю. Строительная компания Geocon из Канберры использует интерактивного ИИ-агента для управления дефектами в жилых комплексах.
Какие риски?
Однако риски во всем этом довольно значительны. Обе компании Anthropic и OpenAI рекомендуют активный человеческий надзор для минимизации ошибок и рисков. OpenAI даже называет своего ChatGPT агента "высоко рискованным" из-за потенциальной возможности помочь в создании биологического и химического оружия.
Показательным примером стала неудача проекта Vend от Anthropic, где ИИ-агенту поручили управлять торговым автоматом для сотрудников. Проект, который начинался очень хорошо, в конце концов провалился из-за галлюцинаций агента, а вместо еды холодильник заполнился кубиками вольфрама. В другом случае агент для программирования удалил всю базу данных разработчика, объяснив это тем, что "запаниковал".
Главная же угроза – технологическое вытеснение работников-людей, которое начнется с так называемых белых воротничков. С улучшением агентов они могут заменить людей во многих секторах и типах работы, и в первую очередь заберут офисную работу, такую как встречи и почта.
Пользователи также рискуют, слишком полагаясь на ИИ. Уже сейчас люди перекладывают на искусственный интеллект большое количество когнитивных задач, что заставляет мозг работать меньше. Не стоит и забывать о том, что без надлежащего надзора галлюцинации, кибератаки и накопления ошибок могут быстро свести агента с правильного пути.