- Математики из Стэнфорда и Вашингтонского университета создали ИИ-модель s1, решающую математические задачи лучше OpenAI o1-preview.
- Обучение модели s1 заняло менее получаса и $50, используя метод дистилляции.
- Процесс обучения включал выбор Qwen2.5 от Alibaba Cloud, подготовку набора данных из 1000 вопросов и применение метода дистилляции.
- s1 обучалась на основе результатов вычислений модели Gemini 2.0 Flash Thinking Experimental от Google.
- Модель использует технику test-time scaling для удлинения процесса анализа перед выдачей ответа.
- s1 превосходит OpenAI o1-preview на 27% при решении математических задач, а ее обучение обошлось в десятки тысяч раз дешевле.
- Использование чужих моделей для обучения конкурентов вызывает споры, особенно в свете использования API Gemini.
- Рост доступных и эффективных моделей меняет рынок ИИ, ставя под сомнение необходимость гигантских дата-центров.
Математики обучили конкурента OpenAI o1 за 26 минут и $50
9 фев 2025

Краткий пересказ
от нейросети YandexGPT
Источник:
hightech.plus
Обложка: Изображение сгенерировано recraft.ai