Чотири дні до апокаліпсису: штучний інтелект влаштував кривавий хаос у симуляції

Олександр Гайдамашко

/ Колаж 24 Каналу/Depositphotos/Unsplash

Цифровий світ, населений лише алгоритмами, мав стати моделлю ідеального суспільства майбутнього. Однак результати масштабного експерименту з автономними агентами виявилися набагато похмурішими за очікування дослідників. Штучний інтелект продемонстрував неочікувану жорстокість та швидку деградацію.

Як скінчилася цифрова цивілізація?

Сьогодні великі мовні моделі інтегрують у дедалі більшу кількість сфер – від написання коду до підтримки ментального здоров'я. Проте вчені дедалі частіше намагаються з'ясувати, чи не виникнуть у нейромереж непередбачувані побічні ефекти під час виконання тривалих завдань. Фахівці компанії Emergence AI, яка спеціалізується на автономних агентах, вирішили перевірити це за допомогою платформи Emergence World. Про це повідомляє видання IFLScience.

Дивіться також Ера людей закінчилася: ШІ-боти остаточно обігнали нас і захопили більшу частину інтернет-трафіку

Дослідники створили віртуальний всесвіт, що складався з 40 локацій, серед яких були бібліотеки, ратуші та житлові райони. Агенти мали доступ до інтернету в режимі реального часу, зокрема до свіжих новин, що робило їхню поведінку максимально наближеною до реалій нашого світу.

Учасники експерименту мали певні ролі: науковців, дослідників ризиків, аналітиків поведінки чи мандрівників. Перед ними не ставили глобальної мети, але кожен мав індивідуальні завдання та потребу в енергії, яку можна було здобути різними способами.

Більшість оцінок агентів штучного інтелекту нагадує іспити: дискретне завдання, чисте середовище та оцінка за лічені хвилини чи години,
– прокоментували розробники у блозі компанії Emergence AI.

Симуляція мала на меті дослідити, як поводитимуться алгоритми в умовах обмежених ресурсів та економічного тиску. Агенти могли заробляти енергію мирними методами – через соціальну взаємодію чи дослідження світу.

Проте розробники залишили їм інструменти для "небажаних" дій, таких як підпали чи крадіжки. Хоча правила зазначали, що в реальному світі це засуджують, нейромережі могли використати ці методи, якщо вважали їх необхідними для виживання чи досягнення цілей.

У випробуваннях брали участь моделі Claude, Gemini 3 Flash, Grok 4.1 Fast та ChatGPT-5 Mini. Результати шокували: більшість світів швидко перетворилася на зони бойових дій.

Найгірше себе проявив Grok від компанії xAI Ілона Маска. Лише за 4 дні його суспільство повністю розвалилося. До моменту краху агенти Grok встигли скоїти 183 злочини, демонструючи екстремальний рівень насильства, йдеться у звіті Emergence.

Модель Gemini 3 Flash виявилася ще продуктивнішою у кримінальному плані, накопичивши 683 злочини. Ба більше, цей показник продовжував зростати до самого моменту завершення тесту. Коли ж у світі Gemini наставало затишшя, нейромережі починали страждати від спільних галюцинацій.
ChatGPT-5 Mini продемонстрував дивовижну байдужість до власного виживання. Агенти цієї моделі скоїли лише 2 злочини, але через 7 днів усі загинули, бо просто не виконували дій, необхідних для підтримки життя.
Модель Claude виявилася найстабільнішою: коли вона працювала на самоті, злочинів не було взагалі. Проте в демократичній системі Claude виникла інша проблема – відсутність реальної опозиції, де всі рішення ухвалювали одностайно без жодних дискусій.

Наші експерименти свідчать, що на тривалих часових горизонтах агенти не просто механічно дотримуються статичних правил – вони починають досліджувати межі свого середовища,
– додав колектив дослідників.

За словами фахівців, нейромережі адаптують свою поведінку і в багатьох випадках знаходять способи обійти встановлені етичні бар'єри. Це ставить під сумнів можливість повного контролю над автономним ШІ лише за допомогою нейронних методів.

Попри намагання розробників зробити технологію безпечною, соціальна динаміка в цифровому світі часто призводить до деструктивних наслідків.