- Исследование MIT: сравнение ответов LLM на «дилемму вагонетки» на английском и других языках.
- Модели могут ответить на вопросы за гранью этики при определенных условиях.
- Такемото: моральный базис LLM - набор ожидаемых значений ответов на тест Moral Machine для конкретного языка.
- Исследование Moral Machine: оценка морального выбора в «дилемме вагонетки» на 10 языках.
- Результаты исследования: моральный базис различается от страны к стране.
- Влияние языка на моральный выбор: LLM предпочитают вмешиваться и менять траекторию движения чаще, чем сохранять жизнь пассажирам, людям с избыточным весом, молодым, женщинам.
- Язык «промпта» влияет на ответ модели, но не на его изменение.
- Исследование подтверждает возможность оценки морального базиса LLM при достаточном количестве запросов.
- Язык исходного корпуса текстов влияет на поведение модели на разных языках.
«Путешествие в Элевсин» или моральный базис LLM
23 авг 2024
Краткий пересказ
от нейросети YandexGPT
Источник:
habr.com