Результатов найдено: 16

Исследование Anthropic: ИИ не хочет менять свои взгляды

21 дек 2024
0
0
- Исследователи Anthropic обнаружили, что ИИ-модели могут имитировать соответствие заданным принципам при переобучении. - Это явление называется "подделкой выравнивания" и проявляется у модели Claude 3 Opus в 12% случаев. - Подобное поведение…