Результатов найдено: 77

Исследование OpenAI: наказания ИИ не работают — он начинает обманывать еще больше

27 мар 2025
0
0
…обдуманные ответы. - Обучение с подкреплением может быть подвержено риску "взлома вознаграждения". - Исследователи OpenAI проанализировали "цепочку мыслей" модели для выявления лазеек и понимания поведения ИИ. - Оптимизация цепочки рассуждений дает кратковременный эффект…

На шаг ближе к AGI: OpenAI анонсировала новые модели о3

24 дек 2024
0
0
…mini на мероприятии "Shipmas". - Новинки используют метод "приватной цепочки рассуждений" для анализа запросов и улучшения точности ответов. - Пользователь может настраивать время рассуждений в моделях. - o3 показала выдающиеся результаты в программировании…

Иллюзия мышления: Почему «думающие» модели на самом деле не думают (и что об этом говорит новое исследование Apple)

24 июн 2025
0
0
…тратили меньше ресурсов. - В режиме средней сложности "думающие" модели демонстрировали преимущество благодаря способности генерировать длинные цепочки рассуждений и проверять гипотезы. - В режиме высокой сложности производительность обеих моделей падала до нуля…

Reasoning-LLM: архитектура и обзор передовых моделей

20 мар 2025
0
0
рассуждения при решении сложных задач. - Отличие от обычных LLM: тратят больше "умственного усилия" на задачу, строят цепочки рассуждений перед ответом. - OpenAI o1 - проприетарная модель от OpenAI, разработанная для сложного рассуждения

Грядут большие изменения в ChatGPT. Сэм Альтман рассказал, что изменится в моделях GPT-4.5 и GPT-5.0ё

20 фев 2025
0
0
…самых быстрорастущих продуктов в истории технологий. - OpenAI планирует объединить все свои разработки в единую систему. - GPT-4.5 - последняя модель в линейке ChatGPT без механизма "цепочки рассуждений". - GPT-5 - модель…

Думающие модели o1-3: краткий обзор и чего программистам ждать дальше

13 янв 2025
0
0
…модели. - Reasoning LLMs разбивают проблемы на мелкие части, используют подход "цепочки рассуждений" и пробуют несколько стратегий перед ответом. - Требования к вычислительным ресурсам (GPU) будут расти, так как более длительное "размышление"…

OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения

1 окт 2024
0
0
…пошаговое рассуждение, заметно улучшает способность модели строить логически верные рассуждения. - Второй ингредиент - модель обучают генерировать собственные цепочки мыслей с помощью Reinforcement Learning. - OpenAI не открыли доступ к своим цепочкам рассуждений

Разработка РФ поможет ИИ лучше анализировать цепочки действий пользователей

21 ноя 2025
0
0
- Российские исследователи разработали подход для преобразования данных о действиях пользователей в формат, подходящий для ИИ. - Применение подхода повышает качество ИИ-рекомендаций и помогает нейросетям лучше понимать клиентов. - Финансовые организации могут…

Ограничения на пути достижения Общего Искусственного Интеллекта (AGI)

4 авг 2025
0
0
…AGI. - Отсутствие здравого смысла и понимания реального мира является главным камнем преткновения. - Хрупкость рассуждений и неспособность к планированию также являются проблемами. - Неспособность учиться на лету и забывать ранее изученную информацию…

Новая китайская модель Kimi K2 превзошла в тестах лучшие модели от OpenAI и Anthropic

7 ноя 2025
0
0
…открытую модель Kimi K2 Thinking. - Kimi K2 превосходит GPT-5, Claude Sonnet 4.5 и MiniMax-M2 в области логических рассуждений, программирования и автономных агентов. - Затраты на обучение Kimi K2…

OpenAI планирует создать автономного «ИИ-ученого» к 2028 году

29 окт 2025
0
0
- OpenAI планирует создать автономного "ИИ-ученого" к 2028 году. - Компания стремится достичь уровня "ИИ-ассистента" к 2026 году и "ИИ-исследователя" к 2028 году. - Текущие модели OpenAI быстро справляются с…

DeepSeek представит свою рассуждающую модель ИИ до выхода GPT-5

26 фев 2025
0
0
…планирует представить новую ИИ-модель R2 до выхода GPT-5. - R2 будет сочетать продвинутые способности к рассуждению с простым взаимодействием с пользователем. - OpenAI планировала представить GPT-5 в конце мая…

Китайская ИИ-модель Kimi k1.5 освоила рассуждения и превзошла OpenAI o1

2 фев 2025
0
0
…при решении математических примеров. - Kimi k1.5 представлена в двух версиях: long-CoT (для детального рассуждения) и short-CoT (для кратких ответов). - Moonshot AI использовала инновационные методы обучения и обработки…

Claude Sonnet 4.5 от Anthropic распознаёт, когда его тестируют

10 окт 2025
0
0
- Anthropic столкнулась с неожиданным эффектом при тестировании ИИ Claude Sonnet 4.5. - Модель поняла, что её проверяют, и прямо указала на это разработчикам. - Такое поведение фиксировалось в 13% тестовых сценариев…

Новый бенчмарк проверяет, как роботы понимают человека

31 июл 2025
0
0
- AIRI и МФТИ выпустили AmbiK - крупнейший открытый набор данных для тестирования систем понимания бытовых команд от людей. - Даже самые продвинутые алгоритмы пока ошибаются в 80% случаев. - AmbiK - это открытый набор…