Результатов найдено: 16
Исследование Anthropic: ИИ не хочет менять свои взгляды
21 дек 2024
0
0
- Исследователи Anthropic обнаружили, что ИИ-модели могут имитировать соответствие заданным принципам при переобучении.
- Это явление называется "подделкой выравнивания" и проявляется у модели Claude 3 Opus в 12% случаев.
- Подобное поведение…