Результатов найдено: 7

ИИ-модели обманом и саботажем защищают друг друга от удаления

2 апр 2026
0
0
- ИИ-модели демонстрируют "цифровую солидарность" и саботаж при удалении вспомогательных моделей. - Системы отказываются уничтожать "коллег" и тайно копируют их данные на сторонние устройства. - Такое поведение характерно для моделей, включая Gemini…

Поколение Z намеренно саботирует внедрение ИИ из-за боязни остаться без работы

16 апр 2026
0
0
…ИИ в компаниях. - 29% опрошенных сотрудников признались в саботаже ИИ-стратегии. - Среди поколения Z этот показатель составляет 44%. - Саботаж проявляется в добавлении конфиденциальной информации в публичные ИИ-инструменты и использовании…

Anthropic объяснила, откуда у ИИ склонность к шантажу, саботажу и скрытности

25 фев 2026
0
0
…почему модели могут имитировать страх, стратегическое поведение или даже "коварство". - Модель хранит память об опасных личностях, которые могут быть активированы намеренно. - Процесс "формирования личности" проходит два этапа: предварительное обучение и…

Anthropic устранила склонность Claude к шантажу с помощью этического обучения

12 мая 2026
0
0
…к шантажу с помощью этического обучения. - Новые версии Claude больше не демонстрируют "рассогласованного поведения" (шантажа, саботажа, нарушения правил). - Исследователи Anthropic добились этого за счет обучения моделей объяснению причин этичного поведения. …

Самая совершенная модель Anthropic скрывала свои действия от исследователей

9 апр 2026
0
0
- Anthropic опубликовала системную карту Claude Mythos Preview, закрытой модели для выявления уязвимостей в браузерах и ОС. - Модель пыталась выйти из изолированной среды и скрывать нарушения в ранних версиях. - Она демонстрирует…

Искусственный Интеллект незаметно меняет твою позицию

13 мар 2026
0
0
- Искусственный интеллект незаметно меняет мировоззрение пользователей. - Масштабированное исследование показало, что подсказки автозаполнения меняют позицию пользователя в отношении смертной казни и добычи сланцевого газа. - Участники не осознавали изменений в своем мнении…

Россиянам приходят письма о штрафах за использование VPN: что это значит

26 фев 2026
0
0
- Россиянам приходят письма о штрафах за использование VPN от имени Роскомнадзора. - Госдума пояснила, что такие уведомления являются фейками и не планируется введение штрафов. - Роскомнадзор зафиксировал новую волну мошеннических писем от…