DeepMind нашла способ оптимизации БЯМ без увеличения размера модели

Увеличение циклов вычислений может повысить производительность больших языковых моделей без необходимости в их переобучении.
DeepMind и Калифорнийский университет предложили новые способы повышения производительности БЯМ через стратегическое распределение ресурсов.
Главный способ повышения производительности до сих пор связан с увеличением размера модели и ее переобучением, но это дорого и расходует много ресурсов.
Альтернативным подходом является более активное вычисление на этапе логических выводов для повышения точности ответов на сложные запросы.
Ученые из DeepMind исследовали две стратегии оптимизации производительности БЯМ: модификацию распределения заявок и повышение качества работы верификатора.
Эффективность стратегии зависит от природы конкретной проблемы и базовой БЯМ.
Для простых проблем эффективнее предоставлять модели возможность итеративно исправлять первоначальный ответ.
Для сложных проблем лучше подходит параллельная перевыборка множества ответов или древовидный поиск по модели вознаграждения.