Результатов найдено: 87
Claude Sonnet 4.5 от Anthropic распознаёт, когда его тестируют
10 окт 2025
0
0
- Anthropic столкнулась с неожиданным эффектом при тестировании ИИ Claude Sonnet 4.5.
- Модель поняла, что её проверяют, и прямо указала на это разработчикам.
- Такое поведение фиксировалось в 13% тестовых сценариев…
Новый бенчмарк проверяет, как роботы понимают человека
31 июл 2025
0
0
- AIRI и МФТИ выпустили AmbiK - крупнейший открытый набор данных для тестирования систем понимания бытовых команд от людей.
- Даже самые продвинутые алгоритмы пока ошибаются в 80% случаев.
- AmbiK - это открытый набор…
Разработана новая архитектура ИИ с "прозрачной" логикой работы
10 июл 2025
0
0
…разработали концепцию ИИ на базе логических клеточных автоматов.
- Логические клеточные автоматы - математические конструкции, описывающие пространство из ячеек-клеток.
- Российские ученые использовали логические клеточные автоматы для создания "прозрачной" системы ИИ для…
Искусственный интеллект обретает здравомыслие: новый метод заставил нейросети сомневаться в своих ответах
24 ноя 2025
0
0
- Новый метод повышает надежность нейронных сетей, обучая их распознавать объекты и ситуации, с которыми они не сталкивались.
- Метод Identity Curvature Laplace Approximation (ICLA) позволяет искусственному интеллекту точнее оценивать собственную неуверенность…
Модель «Базового интеллекта» объясняет, как создать по-настоящему мыслящий ИИ
21 ноя 2025
0
0
- Большие языковые модели, такие как ChatGPT, Gemini и DeepSeek, доминируют на рынке ИИ.
- Авторы нового исследования предлагают модель "Базовый интеллект" для выхода на следующий уровень ИИ.
- Модель "Базовый интеллект" позволяет…
Дженсен Хуанг: будущее ИИ — за системами рассуждения, но нужно снизить стоимость вычислений
14 окт 2024
0
0
…способными к рассуждению.
- Хуанг стремится ежегодно увеличивать производительность чипов Nvidia в 2-3 раза при сохранении стоимости и энергопотребления.
- Системы следующего поколения смогут анализировать собственные выводы и рассуждать.
- Nvidia делает…
ИИ Claude показал способность к мышлению, решив открытую математическую задачу
9 мар 2026
0
0
- ИИ Claude Opus 4.6 от Anthropic решил открытую математическую задачу, связанную с направленными гамильтоновыми циклами.
- Решение задачи вызвало удивление в научном сообществе, включая Дональда Кнута.
- Кнут признал, что произошедшее…
Google научила ИИ мыслить как ученый: представлен Gemini 3 Deep Think
13 фев 2026
0
0
- Google выпустила Gemini 3 Deep Think - специализированный ИИ для решения сложных задач в науке и инженерии.
- Модель способна выявлять логические ошибки в научных статьях, оптимизировать синтез полупроводников и конвертировать эскизы…
Tencent выпустил ИИ-модель Hunyuan 2.0 с 406 млрд параметров
8 дек 2025
0
0
- Tencent выпустила ИИ-модель Hunyuan 2.0 с 406 млрд параметров.
- Модель поддерживает сверхдлинный контекст до 256 тыс. токенов.
- HY2.0 Think демонстрирует лидирующую производительность в сложных логических задачах.
- Модель…
Лучшие модели ИИ сравнялись с человеком в тестах на умозаключения по аналогии
10 ноя 2025
0
0
- Крупные языковые модели ИИ впервые сравнялись с людьми в тестах на умозаключения по аналогии.
- Команда Университета Брауна и Университета Маккуори провела серию тестов, где участникам предлагалось вывести скрытое правило соответствия…
Открытие ученых РФ упростит и удешевит развитие "логических способностей" у ИИ
10 ноя 2025
0
0
…больших языковых моделей, способных вести логические рассуждения.
- Традиционные методы обучения с подкреплением требуют использования большого количества памяти и ресурсов.
- Новый подход предлагает более дешевую и удобную альтернативу, добавляя векторы-настройки…
Ученые Anthropic взломали «мозг» ИИ-модели Claude — и она заметила
30 окт 2025
0
0
- Ученые Anthropic взломали «мозг» ИИ-модели Claude и обнаружили способность к самоанализу.
- В ходе эксперимента исследователи внедряли разные концепции в нейронную активность модели.
- В 20% случаев модель сообщала о навязанных…
Вышла улучшенная версия DeepSeek — на уровне с GPT-5, но на порядок дешевле
20 авг 2025
0
0
…объединяющую функции чата, логического рассуждения и программирования.
- DeepSeek сравнима по производительности с последними моделями OpenAI и Anthropic, но дешевле на 2 порядка.
- Модель работает с контекстом до 128 тысяч токенов…
LLM-судья: как LLM отсекает правду от лжи?
14 мая 2025
0
0
- LLM-as-a-judge - метод оценки качества текстовых ответов продуктов на основе LLM.
- Метод подразумевает использование большой языковой модели с оценочным промптом для выставления оценок сгенерированным текстам.
- LLM-судьи могут…
LLM как концептуальный симулятор для универсальных «теорий всего». Скорректированный прогноз ai-2027.com и другие
24 апр 2025
0
0
- LLM - концептуальные симуляторы для универсальных "теорий всего".
- Развитие LLM позволяет им преобразовывать идеи из одной концептуальной рамки в другую.
- LLM могут использоваться для корректировки прогнозов и метатеорий.
- Развитие ИИ может…