Результатов найдено: 93
Alibaba представила Qwen2.5-Max — конкурента GPT-4o и DeepSeek V1
29 янв 2025
0
0
…4o и DeepSeek V1.
- Qwen2.5-Max превосходит DeepSeek V1 в ключевых бенчмарках.
- Модель обучена на 20 трлн токенов и использует архитектуру Mixture-of-Experts.
- Запуск Qwen2.5-Max и…
Думающие модели o1-3: краткий обзор и чего программистам ждать дальше
13 янв 2025
0
0
…такие как OpenAI, решили воспроизвести внешний этап мышления внутри модели.
- Reasoning LLMs разбивают проблемы на мелкие части, используют подход "цепочки рассуждений" и пробуют несколько стратегий перед ответом.
- Требования к вычислительным…
Alibaba представила «рассуждающую» модель Marco-o1
28 ноя 2024
0
0
…механизм самопроверки позволяет выявлять ошибки и корректировать ход рассуждений.
- Marco-o1 успешно справилась с математическими задачами и языковым переводом на бенчмарках.
- Модель OpenAI o1 хорошо решала задачи со стандартными ответами…