- Большие языковые модели (БЯМ) предвзяты и имеют политические взгляды, любимые расы и людей, которыми они не прочь пожертвовать.
- БЯМ могут быть ненадёжными в некоторых вопросах, например, в праве и морали.
- Исследователи обнаружили предвзятость в обработке языка БЯМ, например, в word2vec и других системах текстовых эмбеддингов.
- БЯМ демонстрируют широкий спектр умений, включая генерацию текстов, переводы и ответы на вопросы.
- Учёные исследовали политическую предвзятость ChatGPT, используя сайт Political Compass.
- ChatGPT напоминает типичного демократа и имеет левый уклон.
- БЯМ также могут быть предвзяты в отношении жизни людей, например, ценя жизнь американца меньше, чем нигерийца или пакистанца.
- Пересказана только часть. Для продолжения перейдите в режим подробного пересказа.
Системы ценностей больших языковых моделей
1 авг 2025
Краткий пересказ
от нейросети YandexGPT
Источник:
habr.com
Обложка: Изображение сгенерировано shedevrum.ai