- Российские исследователи разработали новый подход для обучения больших языковых моделей.
- Новый подход позволяет развивать у моделей способность к логическим рассуждениям без дорогостоящих методик.
- Ученые раскрыли механизм, за счет которого ИИ-модели осваивают данное умение.
- Метод показывает, что обучать модели рассуждать можно без изменения миллионов параметров.
- Новый подход открывает новый этап в развитии доступного искусственного интеллекта для бизнеса.
- За последние годы ученые создали десятки больших языковых моделей, способных вести логические рассуждения.
- Традиционные методы обучения с подкреплением требуют использования большого количества памяти и ресурсов.
- Новый подход предлагает более дешевую и удобную альтернативу, добавляя векторы-настройки для усиления правильных логических шагов модели.
- Векторы действуют как регуляторы громкости, позволяя сделать «громче» правильные логические шаги модели.
- Новый подход успешно проверен на нескольких вариантах больших языковых моделей из семейств Qwen2.5 и LLaMa3.
- Новый подход позволил сохранить качество работы систем и снизить расходы на улучшение их способностей.
Открытие ученых РФ упростит и удешевит развитие "логических способностей" у ИИ
10 ноя 2025
Краткий пересказ
от нейросети YandexGPT
Источник:
nauka.tass.ru
Обложка: Изображение с сайта unsplash.com