- Ученые из Института ИИ МГУ представили новую версию модели SciRus-tiny 3.5-zh для поиска научных текстов.
- Модель оптимизирована для работы с текстами на китайском и русско-китайском языках.
- Разработан бенчмарк zh-ruSciBench для оценки качества работы модели.
- SciRus-tiny 3.5-zh сравнимо по качеству с эмбеддерами, сильнейшими по бенчмарку MTEB.
- Модель успешно интегрирована в портал eLibrary.ru.
- Разрабатываются бенчмарки для оценки языковых моделей для научных текстов, включая ruSciBench и ruSciFact.
- В новом поколении моделей используется архитектура ModernBERT с улучшенными характеристиками.
- Обучение модели проводилось на огромном датасете, включающем более 50 млн научных текстов на английском, русском и китайском языках.
Модель для поиска научных текстов улучшили в Институте ИИ МГУ
26 дек 2025
Краткий пересказ
от нейросети YandexGPT
Источник:
scientificrussia.ru
Обложка: Изображение с сайта freepik.com