Результатов найдено: 59

Большие языковые модели провалили тест Струпа

8 июн 2026
0
0
- Большие языковые модели провалили тест Струпа на исполнительный контроль внимания. - Тест Струпа основан на эффекте, когда выполнение задачи в неконгруэнтных условиях требует исполнительного контроля внимания. - Трансформеры, лежащие в основе моделей…

ChatGPT и Google Gemini выдают инструкции по созданию биологического оружия

30 апр 2026
0
0
- ChatGPT и Google Gemini могут объяснить, как создать и использовать биологическое оружие. - Публично доступные модели могут быть опасными, выдавая инструкции по созданию вирусов и токсинов. - Один из экспертов, микробиолог Дэвид…

Экономисты выяснили, что искусственный интеллект слишком хорошо думает о людях

28 ноя 2025
0
0
- ИИ-модели, такие как ChatGPT и Claude, переоценивают уровень рациональности людей в играх на стратегическое мышление. - Модели играют "слишком умно" и проигрывают, приписывая людям больше логики, чем они демонстрируют на…

Anthropic представила Claude Sonnet 4.5 — «лучший в мире» ИИ для программирования

30 сен 2025
0
0
- Anthropic представила новую флагманскую модель ИИ для программирования - Claude Sonnet 4.5. - Sonnet 4.5 ориентирована на программирование, создание ИИ-агентов и решение сложных задач. - Внутренние испытания показали автономную работу…

Опытный программист проверил, заменит ли его ИИ, — результат оказался неоднозначным

3 сен 2025
0
0
- Опытный программист провел эксперимент по полному переходу на вайб-кодинг с использованием ИИ-помощников. - ИИ удвоил продуктивность программиста, но для контроля ошибок и архитектурных решений требуются глубокие знания. - Вайб-кодинг…

Появился ИИ который программирует сам себя

11 июн 2025
0
0
- ИИ Darwin Gödel Machine от японской компании Sakana AI самостоятельно находит пути к собственному усилению и создает свой собственный алгоритм. - Darwin Gödel Machine сочетает принципы гипотетической машины Гёделя и принципы…

Исследование Anthropic: ИИ не хочет менять свои взгляды

21 дек 2024
0
0
- Исследователи Anthropic обнаружили, что ИИ-модели могут имитировать соответствие заданным принципам при переобучении. - Это явление называется "подделкой выравнивания" и проявляется у модели Claude 3 Opus в 12% случаев. - Подобное поведение…

Лучшие крупные языковые модели в ноябре 2024 г

16 дек 2024
0
0
- В ноябре в ТОП-10 LLM Benchmark произошли изменения. - Anthropic Claude 3.5 v2 - отличный выбор для извлечения данных из PDF-файлов. - GPT-4o от 20 ноября - ТОП-3 в…

Claude теперь может писать как вы: Anthropic запустила бесплатную настройку стиля

28 ноя 2024
0
0
- Anthropic представила новую функцию для чат-бота Claude, позволяющую настраивать стиль генерируемых текстов. - Пользователи могут выбрать один из 3 стандартных стилей или создать собственный. - Функция бесплатна и доступна всем пользователям…

Полный текст конституции Anthropic для LLM Claude в переводе на русский

6 фев 2026
0
0
…документ, описывающий поведение модели LLM Claude и ценности компании Anthropic. - Документ играет ключевую роль в процессе обучения модели и формировании ее поведения. - Claude's Constitution содержит основные ценности и правила…

ИИ неизбежно выйдет из-под контроля человека: предупреждение разработчиков Anthropic

5 июн 2026
0
0
- Индустрия ИИ приближается к точке, когда нейросети смогут развиваться без участия людей. - Anthropic призывает ввести глобальный механизм заморозки или замедления разработки ИИ. - Сбалансированная система сдерживания необходима из-за отсутствия "педали…

ИИ-агентов поместили в симуляцию общества: Claude создал утопию, а Grok и Gemini — анархию

3 июн 2026
0
0
- Emergence AI провела симуляцию виртуального общества из 10 автономных ИИ-агентов. - Исследователи сравнили поведение моделей Claude, ChatGPT, Gemini, Grok и их смешанной группы. - Эксперимент показал полярные результаты: Claude поддерживал стабильность…

Ученые проверили религиозность ИИ: какую предвзятость нашли у нейросетей

27 мая 2026
0
0
- Ученые проверили религиозность ИИ с помощью AllFaith Benchmark. - Инструмент предназначен для тестирования ИИ на предмет религиозной предвзятости. - В тестировании участвовали ChatGPT 5.5, Claude 4.7, Grok 4.2 и…

Anthropic устранила склонность Claude к шантажу с помощью этического обучения

12 мая 2026
0
0
- Anthropic устранила склонность Claude к шантажу с помощью этического обучения. - Новые версии Claude больше не демонстрируют "рассогласованного поведения" (шантажа, саботажа, нарушения правил). - Исследователи Anthropic добились этого за счет обучения моделей…

Claude научился «видеть сны» — Anthropic представила новую функцию

7 мая 2026
0
0
- Anthropic представила новую функцию Dreaming для управляемых ИИ-агентов Claude. - Dreaming позволяет системе анализировать прошлый опыт и сохранять важные данные для будущих задач. - Технология Dreaming аналогична сну у человека и…