Открытие ученых РФ упростит и удешевит развитие "логических способностей" у ИИ

Российские исследователи разработали новый подход для обучения больших языковых моделей.
Новый подход позволяет развивать у моделей способность к логическим рассуждениям без дорогостоящих методик.
Ученые раскрыли механизм, за счет которого ИИ-модели осваивают данное умение.
Метод показывает, что обучать модели рассуждать можно без изменения миллионов параметров.
Новый подход открывает новый этап в развитии доступного искусственного интеллекта для бизнеса.
За последние годы ученые создали десятки больших языковых моделей, способных вести логические рассуждения.
Традиционные методы обучения с подкреплением требуют использования большого количества памяти и ресурсов.
Новый подход предлагает более дешевую и удобную альтернативу, добавляя векторы-настройки для усиления правильных логических шагов модели.
Векторы действуют как регуляторы громкости, позволяя сделать «громче» правильные логические шаги модели.
Новый подход успешно проверен на нескольких вариантах больших языковых моделей из семейств Qwen2.5 и LLaMa3.
Новый подход позволил сохранить качество работы систем и снизить расходы на улучшение их способностей.