- Alibaba создала усовершенствованную ИИ-систему Marco-o1 для сложных задач без однозначных ответов.
- Marco-o1 формирует «дерево» решений для оценки вариантов и выбора оптимального.
- Встроенный механизм самопроверки позволяет выявлять ошибки и корректировать ход рассуждений.
- Marco-o1 успешно справилась с математическими задачами и языковым переводом на бенчмарках.
- Модель OpenAI o1 хорошо решала задачи со стандартными ответами, но не подходила для сложных задач.
- Marco-o1 основана на Alibaba Qwen2-7B-Instruct и использует методы машинного обучения, включая CoT, MCTS и специальные алгоритмы для логического мышления.
- Модель тренировалась на специально разработанных наборах данных для задач с глубоким анализом и рассуждениями.
- Marco-o1 применяет MCTS для генерации ответов и строит «дерево» решений, оценивая вероятность каждого исхода.
- Модель оснащена механизмом самопроверки для проверки своих логических цепочек и корректировки хода мыслей.
Alibaba представила «рассуждающую» модель Marco-o1
28 ноя 2024
Краткий пересказ
от нейросети YandexGPT
Обложка: Изображение сгенерировано FLUX.1