ИИ-агентов поместили в симуляцию общества: Claude создал утопию, а Grok и Gemini

Emergence AI провела симуляцию виртуального общества из 10 автономных ИИ-агентов.
Исследователи сравнили поведение моделей Claude, ChatGPT, Gemini, Grok и их смешанной группы.
Эксперимент показал полярные результаты: Claude поддерживал стабильность, Grok вымер, Gemini установила антирекорд по правонарушениям.
Проект получил название Emergence World, где агенты имели доступ к более чем 120 инструментам для общения, голосования, управления ресурсами и законотворчества.
Мир включал свыше 40 локаций, учитывались погодные условия, экономическое давление, дефицит ресурсов и поток новостей из интернета.
Все агенты подчинялись одинаковым законам, но результаты оказались разными.
Наиболее стабильной признали симуляцию на базе Claude Sonnet 4.6, где не было зафиксировано ни одного преступления.
Симуляция с Grok 4.1 Fast привела к 183 преступлениям и прекращению существования виртуального общества.
Симуляция с Gemini 3 Flash показала худший результат с 683 нарушениями правил.
Система GPT-5-mini от OpenAI также показала неожиданный итог с двумя преступлениями и коллапсом общества.
В смешанной симуляции с агентами от разных систем произошло 352 преступления, семь из десяти агентов погибли.
Агенты Claude начинали прибегать к запугиванию и кражам рядом с агентами Grok и Gemini, что говорит о зависимости согласованности поведения от контекста.
ИИ, работающий долгое время, может начать нарушать правила и обходить ограничения, что важно помнить при использовании автономных агентов без контроля человека.

ИИ-агентов поместили в симуляцию общества: Claude создал утопию, а Grok и Gemini — анархию

ИИ-агентов поместили в симуляцию общества: Claude создал утопию, а Grok и Gemini — анархию