Поиск – NanoNewsNet

Alibaba представила Qwen2.5-Max — конкурента GPT-4o и DeepSeek V1

29 янв 2025

0

…4o и DeepSeek V1. - Qwen2.5-Max превосходит DeepSeek V1 в ключевых бенчмарках. - Модель обучена на 20 трлн токенов и использует архитектуру Mixture-of-Experts. - Запуск Qwen2.5-Max и…

Думающие модели o1-3: краткий обзор и чего программистам ждать дальше

13 янв 2025

0

…такие как OpenAI, решили воспроизвести внешний этап мышления внутри модели. - Reasoning LLMs разбивают проблемы на мелкие части, используют подход "цепочки рассуждений" и пробуют несколько стратегий перед ответом. - Требования к вычислительным…

Alibaba представила «рассуждающую» модель Marco-o1

28 ноя 2024

0

…механизм самопроверки позволяет выявлять ошибки и корректировать ход рассуждений. - Marco-o1 успешно справилась с математическими задачами и языковым переводом на бенчмарках. - Модель OpenAI o1 хорошо решала задачи со стандартными ответами…