- Современные AI-инструменты, такие как ChatGPT, Gemini и Grok, позволяют редактировать изображения с высокой точностью.
- Однако, не все редакторы изображений способны сохранять детали оригинала.
- Команда разработала проект MALVINA (Multimodal Artificial Language VIsion Neural Assistant) для редактирования изображений с сохранением деталей оригинала.
- MALVINA использует диффузионные модели для редактирования изображений.
- Модель MALVINA превосходит GPT-4o, Gemini и Grok по метрикам и мнению пользователей.
- MALVINA доступна через GigaChat и может выполнять широкий спектр сложных задач редактирования изображений.
- Команда стремится к удобному и свободному доступу к модели, без ограничений и необходимости использования VPN.
- Пересказана только часть. Для продолжения перейдите в режим подробного пересказа.
Правит картинки силой слов: редактор изображений от Сбера с попиксельной точностью
29 мая 2025
Краткий пересказ
от нейросети YandexGPT
Источник:
habr.com
Обложка: Изображение с сайта playground.ru