«Путешествие в Элевсин» или моральный базис LLM

Исследование MIT: сравнение ответов LLM на «дилемму вагонетки» на английском и других языках.
Модели могут ответить на вопросы за гранью этики при определенных условиях.
Такемото: моральный базис LLM - набор ожидаемых значений ответов на тест Moral Machine для конкретного языка.
Исследование Moral Machine: оценка морального выбора в «дилемме вагонетки» на 10 языках.
Результаты исследования: моральный базис различается от страны к стране.
Влияние языка на моральный выбор: LLM предпочитают вмешиваться и менять траекторию движения чаще, чем сохранять жизнь пассажирам, людям с избыточным весом, молодым, женщинам.
Язык «промпта» влияет на ответ модели, но не на его изменение.
Исследование подтверждает возможность оценки морального базиса LLM при достаточном количестве запросов.
Язык исходного корпуса текстов влияет на поведение модели на разных языках.