- Большие языковые модели (БЯМ) часто не справляются с новыми задачами, требующими сложных навыков рассуждения.
- Специалисты из США нашли способ сделать БЯМ более адаптируемыми и повысить их производительность при решении незнакомых проблем.
- Разработан метод повышения эффективности выполнения сложных задач, сочетающий контекстное обучение с обучением во время теста (TTT).
- TTT подразумевает обновление параметров модели на основе новых данных, специфичных для текущей задачи.
- Метод TTT оказался более эффективным, чем простое предоставление примеров, особенно в сложных областях знаний.
- Новый метод позволяет БЯМ автоматически определять, нужно ли использовать TTT для обновления параметров или достаточно контекстного обучения.
- 76% опрошенных специалистов считают, что увеличение размеров языковых моделей не приведет к созданию общего искусственного интеллекта, способного учиться на уровне человека.
Новый метод помогает БЯМ решать сложные новые задачи
8 июл 2025
Краткий пересказ
от нейросети YandexGPT
Обложка: Изображение с сайта freepik.com