Третья фаза ИИ: что такое агенты искусственного интеллекта, как они работают и как изменят жизнь

Александр Гайдамашко

Основні тези

ИИ-агенты могут выполнять сложные задачи без постоянного надзора человека, но создают новые риски для рабочих мест и безопасности.
Разработчики, такие как OpenAI, Microsoft и Google, уже внедряют такие агенты, но подчеркивают необходимость человеческого надзора из-за потенциальных рисков.
Примеры применения включают автоматизацию бизнес-процессов и программирование, но есть случаи неудач из-за ошибок агентов.

Эпоха обычных чат-ботов уходит, им на смену приходят ИИ-агенты, способные работать самостоятельно и выполнять сложные задачи без постоянного присмотра человека. Эти системы уже умеют покупать недвижимость, искать билеты в кино и ресторан, писать код и даже управлять бизнесом. В то же время эти технологии создают новые риски для рабочих мест и безопасности.

Что такое ИИ-агенты и в чем их преимущество?

Развитие генеративного искусственного интеллекта сейчас прошло три основных этапа. Сначала появились чат-боты вроде ChatGPT, которые революционизировали общение с машинами в ноябре 2022 года. Затем наступила эра ИИ-ассистентов, построенных на тех же языковых моделях, но предназначенных для выполнения конкретных задач под наблюдением людей. Теперь наступает третья фаза – ИИ-агенты, пишет 24 Канал.

В отличие от предшественников, агенты предназначены для достижения комплексных целей, а не выполнения отдельных задач, как об этом говорят сами разработчики. Но в чем же разница? Эти системы имеют развитые возможности рассуждения и памяти, могут работать в командах и использовать различные программные инструменты – от веб-браузеров до систем оплаты. Самым ярким примером стала новая версия ChatGPT Агента от OpenAI, которая объединяет два продукта (Operator и Deep Research) в единую мощную систему, что, по словам разработчиков, "думает и действует".

Бум разработки агентов начался в прошлом году. Важной вехой стал октябрь, когда Anthropic предоставила своему чат-боту Claude способность взаимодействовать с компьютером так же, как это делает человек. Все что вам нужно сделать – это дать программе какое-то задание, а потом просто наблюдать за работой. Агент начинает серфить в интернете, вводить в браузер поисковые запросы, искать и обрабатывать для вас информацию в различных источниках, нажимать на кнопки и ссылки, заполнять онлайн-формы и прочее.

Например, вы можете попросить купить необходимые вещи для вечеринки. Функция Computer use в составе Claude сама проанализирует, что именно вам может быть нужно (или предоставьте собственный список), затем зайдет в интернет-магазин, осуществит поиск, проанализирует характеристики и цены и добавит все товары в корзину. Вам остается только подтвердить оплату.

Функция Computer use для автоматизации операций: видео

Функция Computer use для выполнения поиска в интернете: видео

Другие разработчики быстро подхватили тренд. OpenAI выпустила веб-агента Operator, Microsoft анонсировала Агентов Copilot, а Google и Meta запустили собственные решения – Vertex AI и Llama Агенты соответственно.
Китайские стартапы также не остались в стороне. Компания Monica продемонстрировала свой Manus AI Агент, который покупал недвижимость и превращал записи лекций в сжатые конспекты. Другой стартап Genspark создал поискового агента, выдающего одностраничные обзоры со ссылками на полезные задачи.
Специализированные агенты показывают особенно впечатляющие результаты. В сфере программирования лидируют Microsoft Copilot и OpenAI Codex – они самостоятельно пишут, оценивают и добавляют код, а также проверяют человеческий код на ошибки.
Но и Claude не сильно отстает. Его функции кодирования настолько хороши и популярны, что компания объявила о внедрении лимитов на запросы, причем делает она это даже в платных версиях, поскольку серверы просто не справляются.
Для научных исследований Google разработала ИИ "со-соученого" (AI co-scientist) – сложную мультиагентную систему, предназначенную для генерации новых идей и исследовательских предложений.
OpenAI Deep Research выполняет комплексные задачи через многоэтапные онлайн-исследования.

Практическое применение уже началось. В 2024 году телекоммуникационная компания Telstra массово внедрила подписки на Microsoft Copilot. По данным компании, ИИ-генерированные резюме встреч и черновики контента экономят сотрудникам в среднем 1-2 часа в неделю. Строительная компания Geocon из Канберры использует интерактивного ИИ-агента для управления дефектами в жилых комплексах.

Какие риски?

Однако риски во всем этом довольно значительны. Обе компании Anthropic и OpenAI рекомендуют активный человеческий надзор для минимизации ошибок и рисков. OpenAI даже называет своего ChatGPT агента "высоко рискованным" из-за потенциальной возможности помочь в создании биологического и химического оружия.

Показательным примером стала неудача проекта Vend от Anthropic, где ИИ-агенту поручили управлять торговым автоматом для сотрудников. Проект, который начинался очень хорошо, в конце концов провалился из-за галлюцинаций агента, а вместо еды холодильник заполнился кубиками вольфрама. В другом случае агент для программирования удалил всю базу данных разработчика, объяснив это тем, что "запаниковал".

Главная же угроза – технологическое вытеснение работников-людей, которое начнется с так называемых белых воротничков. С улучшением агентов они могут заменить людей во многих секторах и типах работы, и в первую очередь заберут офисную работу, такую как встречи и почта.

Пользователи также рискуют, слишком полагаясь на ИИ. Уже сейчас люди перекладывают на искусственный интеллект большое количество когнитивных задач, что заставляет мозг работать меньше. Не стоит и забывать о том, что без надлежащего надзора галлюцинации, кибератаки и накопления ошибок могут быстро свести агента с правильного пути.

Связанные темы:

Техно

Искусственный интеллект

Советы Техно 24 Эксклюзив Техно 24