Результатов найдено: 61
Anthropic объяснила, откуда у ИИ склонность к шантажу, саботажу и скрытности
25 фев 2026
0
0
- Anthropic представила новую теорию поведения больших языковых моделей - Persona Selection Model (PSM).
- PSM объясняет, почему модели могут имитировать страх, стратегическое поведение или даже "коварство".
- Модель хранит память об опасных личностях…