- Сбер выложил в открытый доступ первую в России диффузионную языковую модель GFusion.
- Модель генерирует текст параллельно, работает до 45% быстрее GigaChat 3.
- Код и метод обучения опубликованы в открытом доступе.
- Классические языковые модели пишут текст последовательно, GFusion - параллельно.
- GFusion создает черновой набросок ответа и дорабатывает его пошагово.
- Диффузионные модели извлекают больше информации из ограниченного объема данных.
- Сбер опубликовал инструменты для ускорения обучения диффузионных моделей.
- Разработчики внесли изменения в SGLang для поддержки GFusion и нового алгоритма генерации.
- Технический директор GigaChat назвал проект показателем уровня задач для молодых исследователей.
- Диффузионные языковые модели активно развиваются с конца 2025 года, обеспечивая автодополнение кода, агентные сценарии и поддержку приложений.
Сбер выложил в открытый доступ первую в России диффузионную языковую модель
3 июл 2026
Краткий пересказ
от нейросети YandexGPT
Источник:
hightech.fm
Обложка: Изображение из статьи