Музыкальный ИИ Nvidia «генерирует звуки, которых никто не слышал»

Nvidia представила модель искусственного интеллекта Fugatto для генерации и редактирования музыки, речи и звуков на основе текстовых описаний.
Модель может редактировать готовые аудиофайлы и создавать немыслимые сочетания звуков.
Для создания Fugatto был собран обширный набор данных, включающий миллионы аудиосэмплов.
Разработаны специальные инструкции для расширения спектра задач модели и повышения точности работы.
Главная особенность Fugatto - способность создавать принципиально новые композиции, не только имитируя существующие звуки.
Модель может генерировать звуки и музыку, не «слышала» при обучении.
Fugatto может использоваться для прототипирования и редактирования композиций, добавления эффектов и экспериментов с новыми жанрами и стилями.
Рекламные агентства могут адаптировать кампании под разные рынки с помощью Fugatto.
Nvidia пока не уточняет, когда и как технология станет доступной для открытого использования.

https://youtu.be/qj1Sp8He6e4