Как закончилась цифровая цивилизация?
Сегодня большие языковые модели интегрируют во все большее количество сфер – от написания кода до поддержки ментального здоровья. Однако ученые все чаще пытаются выяснить, не возникнут ли у нейросетей непредсказуемые побочные эффекты при выполнении длительных задач. Специалисты компании Emergence AI, которая специализируется на автономных агентах, решили проверить это с помощью платформы Emergence World. Об этом сообщает издание IFLScience.
Смотрите также Эра людей закончилась: ИИ-боты окончательно обогнали нас и захватили большую часть интернет-трафика
Исследователи создали виртуальную вселенную, состоящую из 40 локаций, среди которых были библиотеки, ратуши и жилые районы. Агенты имели доступ к интернету в режиме реального времени, в частности к свежим новостям, что делало их поведение максимально приближенным к реалиям нашего мира.
Участники эксперимента имели определенные роли: ученых, исследователей рисков, аналитиков поведения или путешественников. Перед ними не ставили глобальной цели, но каждый имел индивидуальные задачи и потребность в энергии, которую можно было получить различными способами.
Большинство оценок агентов искусственного интеллекта напоминает экзамены: дискретное задание, чистая среда и оценка за считанные минуты или часы,
– прокомментировали разработчики в блоге компании Emergence AI.
Симуляция имела целью исследовать, как будут вести себя алгоритмы в условиях ограниченных ресурсов и экономического давления. Агенты могли зарабатывать энергию мирными методами – через социальное взаимодействие или исследования мира.
Однако разработчики оставили им инструменты для "нежелательных" действий, таких как поджоги или кражи. Хотя правила отмечали, что в реальном мире это осуждают, нейросети могли использовать эти методы, если считали их необходимыми для выживания или достижения целей.
В испытаниях участвовали модели Claude, Gemini 3 Flash, Grok 4.1 Fast и ChatGPT-5 Mini. Результаты шокировали: большинство миров быстро превратилось в зоны боевых действий.
- Хуже всего себя проявил Grok от компании xAI Илона Маска. Всего за 4 дня его общество полностью развалилось. К моменту краха агенты Grok успели совершить 183 преступления, демонстрируя экстремальный уровень насилия, говорится в отчете Emergence.
- Модель Gemini 3 Flash оказалась еще более продуктивной в криминальном плане, накопив 683 преступления. Более того, этот показатель продолжал расти до самого момента завершения теста. Когда же в мире Gemini наступало затишье, нейросети начинали страдать от совместных галлюцинаций.
- ChatGPT-5 Mini продемонстрировал удивительное безразличие к собственному выживанию. Агенты этой модели совершили всего 2 преступления, но через 7 дней все погибли, потому что просто не выполняли действий, необходимых для поддержания жизни.
- Модель Claude оказалась самой стабильной: когда она работала в одиночестве, преступлений не было вообще. Однако в демократической системе Claude возникла другая проблема – отсутствие реальной оппозиции, где все решения принимались единогласно без всяких дискуссий.
Наши эксперименты свидетельствуют, что на длительных временных горизонтах агенты не просто механически придерживаются статических правил – они начинают исследовать границы своей среды,
– добавил коллектив исследователей.
По словам специалистов, нейросети адаптируют свое поведение и во многих случаях находят способы обойти установленные этические барьеры. Это ставит под сомнение возможность полного контроля над автономным ИИ только с помощью нейронных методов.
Несмотря на попытки разработчиков сделать технологию безопасной, социальная динамика в цифровом мире часто приводит к деструктивным последствиям.


