Четыре дня до апокалипсиса: искусственный интеллект устроил кровавый хаос в симуляции

Александр Гайдамашко

Grok от Илона Маска устроил всплеск насилия и коллапс в симуляции

/ Коллаж 24 Канала/Depositphotos/Unsplash

Цифровой мир, населенный только алгоритмами, должен был стать моделью идеального общества будущего. Однако результаты масштабного эксперимента с автономными агентами оказались гораздо мрачнее ожиданий исследователей. Искусственный интеллект продемонстрировал неожиданную жестокость и быструю деградацию.

Как закончилась цифровая цивилизация?

Сегодня большие языковые модели интегрируют во все большее количество сфер – от написания кода до поддержки ментального здоровья. Однако ученые все чаще пытаются выяснить, не возникнут ли у нейросетей непредсказуемые побочные эффекты при выполнении длительных задач. Специалисты компании Emergence AI, которая специализируется на автономных агентах, решили проверить это с помощью платформы Emergence World. Об этом сообщает издание IFLScience.

Исследователи создали виртуальную вселенную, состоящую из 40 локаций, среди которых были библиотеки, ратуши и жилые районы. Агенты имели доступ к интернету в режиме реального времени, в частности к свежим новостям, что делало их поведение максимально приближенным к реалиям нашего мира.

Участники эксперимента имели определенные роли: ученых, исследователей рисков, аналитиков поведения или путешественников. Перед ними не ставили глобальной цели, но каждый имел индивидуальные задачи и потребность в энергии, которую можно было получить различными способами.

Большинство оценок агентов искусственного интеллекта напоминает экзамены: дискретное задание, чистая среда и оценка за считанные минуты или часы,
– прокомментировали разработчики в блоге компании Emergence AI.

Симуляция имела целью исследовать, как будут вести себя алгоритмы в условиях ограниченных ресурсов и экономического давления. Агенты могли зарабатывать энергию мирными методами – через социальное взаимодействие или исследования мира.

Однако разработчики оставили им инструменты для "нежелательных" действий, таких как поджоги или кражи. Хотя правила отмечали, что в реальном мире это осуждают, нейросети могли использовать эти методы, если считали их необходимыми для выживания или достижения целей.

В испытаниях участвовали модели Claude, Gemini 3 Flash, Grok 4.1 Fast и ChatGPT-5 Mini. Результаты шокировали: большинство миров быстро превратилось в зоны боевых действий.

Хуже всего себя проявил Grok от компании xAI Илона Маска. Всего за 4 дня его общество полностью развалилось. К моменту краха агенты Grok успели совершить 183 преступления, демонстрируя экстремальный уровень насилия, говорится в отчете Emergence.

Модель Gemini 3 Flash оказалась еще более продуктивной в криминальном плане, накопив 683 преступления. Более того, этот показатель продолжал расти до самого момента завершения теста. Когда же в мире Gemini наступало затишье, нейросети начинали страдать от совместных галлюцинаций.
ChatGPT-5 Mini продемонстрировал удивительное безразличие к собственному выживанию. Агенты этой модели совершили всего 2 преступления, но через 7 дней все погибли, потому что просто не выполняли действий, необходимых для поддержания жизни.
Модель Claude оказалась самой стабильной: когда она работала в одиночестве, преступлений не было вообще. Однако в демократической системе Claude возникла другая проблема – отсутствие реальной оппозиции, где все решения принимались единогласно без всяких дискуссий.

Наши эксперименты свидетельствуют, что на длительных временных горизонтах агенты не просто механически придерживаются статических правил – они начинают исследовать границы своей среды,
– добавил коллектив исследователей.

По словам специалистов, нейросети адаптируют свое поведение и во многих случаях находят способы обойти установленные этические барьеры. Это ставит под сомнение возможность полного контроля над автономным ИИ только с помощью нейронных методов.

Несмотря на попытки разработчиков сделать технологию безопасной, социальная динамика в цифровом мире часто приводит к деструктивным последствиям.