Результатов найдено: 77
Исследование OpenAI: наказания ИИ не работают — он начинает обманывать еще больше
27 мар 2025
0
0
…обдуманные ответы.
- Обучение с подкреплением может быть подвержено риску "взлома вознаграждения".
- Исследователи OpenAI проанализировали "цепочку мыслей" модели для выявления лазеек и понимания поведения ИИ.
- Оптимизация цепочки рассуждений дает кратковременный эффект…
На шаг ближе к AGI: OpenAI анонсировала новые модели о3
24 дек 2024
0
0
…mini на мероприятии "Shipmas".
- Новинки используют метод "приватной цепочки рассуждений" для анализа запросов и улучшения точности ответов.
- Пользователь может настраивать время рассуждений в моделях.
- o3 показала выдающиеся результаты в программировании…
Иллюзия мышления: Почему «думающие» модели на самом деле не думают (и что об этом говорит новое исследование Apple)
24 июн 2025
0
0
…тратили меньше ресурсов.
- В режиме средней сложности "думающие" модели демонстрировали преимущество благодаря способности генерировать длинные цепочки рассуждений и проверять гипотезы.
- В режиме высокой сложности производительность обеих моделей падала до нуля…
Reasoning-LLM: архитектура и обзор передовых моделей
20 мар 2025
0
0
…рассуждения при решении сложных задач.
- Отличие от обычных LLM: тратят больше "умственного усилия" на задачу, строят цепочки рассуждений перед ответом.
- OpenAI o1 - проприетарная модель от OpenAI, разработанная для сложного рассуждения…
Грядут большие изменения в ChatGPT. Сэм Альтман рассказал, что изменится в моделях GPT-4.5 и GPT-5.0ё
20 фев 2025
0
0
…самых быстрорастущих продуктов в истории технологий.
- OpenAI планирует объединить все свои разработки в единую систему.
- GPT-4.5 - последняя модель в линейке ChatGPT без механизма "цепочки рассуждений".
- GPT-5 - модель…
Думающие модели o1-3: краткий обзор и чего программистам ждать дальше
13 янв 2025
0
0
…модели.
- Reasoning LLMs разбивают проблемы на мелкие части, используют подход "цепочки рассуждений" и пробуют несколько стратегий перед ответом.
- Требования к вычислительным ресурсам (GPU) будут расти, так как более длительное "размышление"…
OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения
1 окт 2024
0
0
…пошаговое рассуждение, заметно улучшает способность модели строить логически верные рассуждения.
- Второй ингредиент - модель обучают генерировать собственные цепочки мыслей с помощью Reinforcement Learning.
- OpenAI не открыли доступ к своим цепочкам рассуждений…
Разработка РФ поможет ИИ лучше анализировать цепочки действий пользователей
21 ноя 2025
0
0
- Российские исследователи разработали подход для преобразования данных о действиях пользователей в формат, подходящий для ИИ.
- Применение подхода повышает качество ИИ-рекомендаций и помогает нейросетям лучше понимать клиентов.
- Финансовые организации могут…
Ограничения на пути достижения Общего Искусственного Интеллекта (AGI)
4 авг 2025
0
0
…AGI.
- Отсутствие здравого смысла и понимания реального мира является главным камнем преткновения.
- Хрупкость рассуждений и неспособность к планированию также являются проблемами.
- Неспособность учиться на лету и забывать ранее изученную информацию…
Новая китайская модель Kimi K2 превзошла в тестах лучшие модели от OpenAI и Anthropic
7 ноя 2025
0
0
…открытую модель Kimi K2 Thinking.
- Kimi K2 превосходит GPT-5, Claude Sonnet 4.5 и MiniMax-M2 в области логических рассуждений, программирования и автономных агентов.
- Затраты на обучение Kimi K2…
OpenAI планирует создать автономного «ИИ-ученого» к 2028 году
29 окт 2025
0
0
- OpenAI планирует создать автономного "ИИ-ученого" к 2028 году.
- Компания стремится достичь уровня "ИИ-ассистента" к 2026 году и "ИИ-исследователя" к 2028 году.
- Текущие модели OpenAI быстро справляются с…
DeepSeek представит свою рассуждающую модель ИИ до выхода GPT-5
26 фев 2025
0
0
…планирует представить новую ИИ-модель R2 до выхода GPT-5.
- R2 будет сочетать продвинутые способности к рассуждению с простым взаимодействием с пользователем.
- OpenAI планировала представить GPT-5 в конце мая…
Китайская ИИ-модель Kimi k1.5 освоила рассуждения и превзошла OpenAI o1
2 фев 2025
0
0
…при решении математических примеров.
- Kimi k1.5 представлена в двух версиях: long-CoT (для детального рассуждения) и short-CoT (для кратких ответов).
- Moonshot AI использовала инновационные методы обучения и обработки…
Claude Sonnet 4.5 от Anthropic распознаёт, когда его тестируют
10 окт 2025
0
0
- Anthropic столкнулась с неожиданным эффектом при тестировании ИИ Claude Sonnet 4.5.
- Модель поняла, что её проверяют, и прямо указала на это разработчикам.
- Такое поведение фиксировалось в 13% тестовых сценариев…
Новый бенчмарк проверяет, как роботы понимают человека
31 июл 2025
0
0
- AIRI и МФТИ выпустили AmbiK - крупнейший открытый набор данных для тестирования систем понимания бытовых команд от людей.
- Даже самые продвинутые алгоритмы пока ошибаются в 80% случаев.
- AmbiK - это открытый набор…