Системы ценностей больших языковых моделей

Большие языковые модели (БЯМ) предвзяты и имеют политические взгляды, любимые расы и людей, которыми они не прочь пожертвовать.
БЯМ могут быть ненадёжными в некоторых вопросах, например, в праве и морали.
Исследователи обнаружили предвзятость в обработке языка БЯМ, например, в word2vec и других системах текстовых эмбеддингов.
БЯМ демонстрируют широкий спектр умений, включая генерацию текстов, переводы и ответы на вопросы.
Учёные исследовали политическую предвзятость ChatGPT, используя сайт Political Compass.
ChatGPT напоминает типичного демократа и имеет левый уклон.
БЯМ также могут быть предвзяты в отношении жизни людей, например, ценя жизнь американца меньше, чем нигерийца или пакистанца.
Пересказана только часть. Для продолжения перейдите в режим подробного пересказа.