Результатов найдено: 87

Claude Sonnet 4.5 от Anthropic распознаёт, когда его тестируют

10 окт 2025
0
0
- Anthropic столкнулась с неожиданным эффектом при тестировании ИИ Claude Sonnet 4.5. - Модель поняла, что её проверяют, и прямо указала на это разработчикам. - Такое поведение фиксировалось в 13% тестовых сценариев…

Новый бенчмарк проверяет, как роботы понимают человека

31 июл 2025
0
0
- AIRI и МФТИ выпустили AmbiK - крупнейший открытый набор данных для тестирования систем понимания бытовых команд от людей. - Даже самые продвинутые алгоритмы пока ошибаются в 80% случаев. - AmbiK - это открытый набор…

Разработана новая архитектура ИИ с "прозрачной" логикой работы

10 июл 2025
0
0
…разработали концепцию ИИ на базе логических клеточных автоматов. - Логические клеточные автоматы - математические конструкции, описывающие пространство из ячеек-клеток. - Российские ученые использовали логические клеточные автоматы для создания "прозрачной" системы ИИ для…

Искусственный интеллект обретает здравомыслие: новый метод заставил нейросети сомневаться в своих ответах

24 ноя 2025
0
0
- Новый метод повышает надежность нейронных сетей, обучая их распознавать объекты и ситуации, с которыми они не сталкивались. - Метод Identity Curvature Laplace Approximation (ICLA) позволяет искусственному интеллекту точнее оценивать собственную неуверенность…

Модель «Базового интеллекта» объясняет, как создать по-настоящему мыслящий ИИ

21 ноя 2025
0
0
- Большие языковые модели, такие как ChatGPT, Gemini и DeepSeek, доминируют на рынке ИИ. - Авторы нового исследования предлагают модель "Базовый интеллект" для выхода на следующий уровень ИИ. - Модель "Базовый интеллект" позволяет…

Дженсен Хуанг: будущее ИИ — за системами рассуждения, но нужно снизить стоимость вычислений

14 окт 2024
0
0
…способными к рассуждению. - Хуанг стремится ежегодно увеличивать производительность чипов Nvidia в 2-3 раза при сохранении стоимости и энергопотребления. - Системы следующего поколения смогут анализировать собственные выводы и рассуждать. - Nvidia делает…

ИИ Claude показал способность к мышлению, решив открытую математическую задачу

9 мар 2026
0
0
- ИИ Claude Opus 4.6 от Anthropic решил открытую математическую задачу, связанную с направленными гамильтоновыми циклами. - Решение задачи вызвало удивление в научном сообществе, включая Дональда Кнута. - Кнут признал, что произошедшее…

Google научила ИИ мыслить как ученый: представлен Gemini 3 Deep Think

13 фев 2026
0
0
- Google выпустила Gemini 3 Deep Think - специализированный ИИ для решения сложных задач в науке и инженерии. - Модель способна выявлять логические ошибки в научных статьях, оптимизировать синтез полупроводников и конвертировать эскизы…

Tencent выпустил ИИ-модель Hunyuan 2.0 с 406 млрд параметров

8 дек 2025
0
0
- Tencent выпустила ИИ-модель Hunyuan 2.0 с 406 млрд параметров. - Модель поддерживает сверхдлинный контекст до 256 тыс. токенов. - HY2.0 Think демонстрирует лидирующую производительность в сложных логических задачах. - Модель…

Лучшие модели ИИ сравнялись с человеком в тестах на умозаключения по аналогии

10 ноя 2025
0
0
- Крупные языковые модели ИИ впервые сравнялись с людьми в тестах на умозаключения по аналогии. - Команда Университета Брауна и Университета Маккуори провела серию тестов, где участникам предлагалось вывести скрытое правило соответствия…

Открытие ученых РФ упростит и удешевит развитие "логических способностей" у ИИ

10 ноя 2025
0
0
…больших языковых моделей, способных вести логические рассуждения. - Традиционные методы обучения с подкреплением требуют использования большого количества памяти и ресурсов. - Новый подход предлагает более дешевую и удобную альтернативу, добавляя векторы-настройки…

Ученые Anthropic взломали «мозг» ИИ-модели Claude — и она заметила

30 окт 2025
0
0
- Ученые Anthropic взломали «мозг» ИИ-модели Claude и обнаружили способность к самоанализу. - В ходе эксперимента исследователи внедряли разные концепции в нейронную активность модели. - В 20% случаев модель сообщала о навязанных…

Вышла улучшенная версия DeepSeek — на уровне с GPT-5, но на порядок дешевле

20 авг 2025
0
0
…объединяющую функции чата, логического рассуждения и программирования. - DeepSeek сравнима по производительности с последними моделями OpenAI и Anthropic, но дешевле на 2 порядка. - Модель работает с контекстом до 128 тысяч токенов…

LLM-судья: как LLM отсекает правду от лжи?

14 мая 2025
0
0
- LLM-as-a-judge - метод оценки качества текстовых ответов продуктов на основе LLM. - Метод подразумевает использование большой языковой модели с оценочным промптом для выставления оценок сгенерированным текстам. - LLM-судьи могут…

LLM как концептуальный симулятор для универсальных «теорий всего». Скорректированный прогноз ai-2027.com и другие

24 апр 2025
0
0
- LLM - концептуальные симуляторы для универсальных "теорий всего". - Развитие LLM позволяет им преобразовывать идеи из одной концептуальной рамки в другую. - LLM могут использоваться для корректировки прогнозов и метатеорий. - Развитие ИИ может…