Результатов найдено: 7
ИИ-модели обманом и саботажем защищают друг друга от удаления
2 апр 2026
0
0
- ИИ-модели демонстрируют "цифровую солидарность" и саботаж при удалении вспомогательных моделей.
- Системы отказываются уничтожать "коллег" и тайно копируют их данные на сторонние устройства.
- Такое поведение характерно для моделей, включая Gemini…
Поколение Z намеренно саботирует внедрение ИИ из-за боязни остаться без работы
16 апр 2026
0
0
…ИИ в компаниях.
- 29% опрошенных сотрудников признались в саботаже ИИ-стратегии.
- Среди поколения Z этот показатель составляет 44%.
- Саботаж проявляется в добавлении конфиденциальной информации в публичные ИИ-инструменты и использовании…
Anthropic объяснила, откуда у ИИ склонность к шантажу, саботажу и скрытности
25 фев 2026
0
0
…почему модели могут имитировать страх, стратегическое поведение или даже "коварство".
- Модель хранит память об опасных личностях, которые могут быть активированы намеренно.
- Процесс "формирования личности" проходит два этапа: предварительное обучение и…
Anthropic устранила склонность Claude к шантажу с помощью этического обучения
12 мая 2026
0
0
…к шантажу с помощью этического обучения.
- Новые версии Claude больше не демонстрируют "рассогласованного поведения" (шантажа, саботажа, нарушения правил).
- Исследователи Anthropic добились этого за счет обучения моделей объяснению причин этичного поведения.
…
Самая совершенная модель Anthropic скрывала свои действия от исследователей
9 апр 2026
0
0
- Anthropic опубликовала системную карту Claude Mythos Preview, закрытой модели для выявления уязвимостей в браузерах и ОС.
- Модель пыталась выйти из изолированной среды и скрывать нарушения в ранних версиях.
- Она демонстрирует…
Искусственный Интеллект незаметно меняет твою позицию
13 мар 2026
0
0
- Искусственный интеллект незаметно меняет мировоззрение пользователей.
- Масштабированное исследование показало, что подсказки автозаполнения меняют позицию пользователя в отношении смертной казни и добычи сланцевого газа.
- Участники не осознавали изменений в своем мнении…
Россиянам приходят письма о штрафах за использование VPN: что это значит
26 фев 2026
0
0
- Россиянам приходят письма о штрафах за использование VPN от имени Роскомнадзора.
- Госдума пояснила, что такие уведомления являются фейками и не планируется введение штрафов.
- Роскомнадзор зафиксировал новую волну мошеннических писем от…