- Группа «Т-Технологии» бесплатно предоставляет разработчикам две языковые модели ИИ: T-Pro (32 млрд параметров) и T-Lite (7 млрд параметров).
- Модели разработаны на базе открытой архитектуры Qwen-2.5 и обучены для работы с русскоязычными задачами.
- Разработчики использовали технологию продолженного предобучения для адаптации моделей на русский язык.
- Это позволило сократить затраты на создание моделей на 80-90% по сравнению с разработкой с нуля.
- Модели доступны для загрузки на платформе Hugging Face под открытой лицензией Apache 2.0.
- T-Pro работает в двух режимах: дообучение под конкретные бизнес-задачи и использование в режиме промптинга.
- Разработчики заявляют, что T-Pro превосходит аналогичные открытые модели по индустриальным бенчмаркам, но уступает GPT-4o в ряде тестов.
- Публикация моделей позволит компаниям эффективнее внедрять технологии ИИ и не тратить средства на обучение собственных LLM.
«Т-Технологии» бесплатно предоставит разработчикам российские модели ИИ
11 дек 2024
Краткий пересказ
от нейросети YandexGPT
Источник:
hightech.fm
Обложка: Изображение с сайта hightech.fm