- Nvidia представила модель искусственного интеллекта Fugatto для генерации и редактирования музыки, речи и звуков на основе текстовых описаний.
- Модель может редактировать готовые аудиофайлы и создавать немыслимые сочетания звуков.
- Для создания Fugatto был собран обширный набор данных, включающий миллионы аудиосэмплов.
- Разработаны специальные инструкции для расширения спектра задач модели и повышения точности работы.
- Главная особенность Fugatto - способность создавать принципиально новые композиции, не только имитируя существующие звуки.
- Модель может генерировать звуки и музыку, не «слышала» при обучении.
- Fugatto может использоваться для прототипирования и редактирования композиций, добавления эффектов и экспериментов с новыми жанрами и стилями.
- Рекламные агентства могут адаптировать кампании под разные рынки с помощью Fugatto.
- Nvidia пока не уточняет, когда и как технология станет доступной для открытого использования.
Музыкальный ИИ Nvidia «генерирует звуки, которых никто не слышал»
26 ноя 2024
Краткий пересказ
от нейросети YandexGPT
Обложка: Изображение сгенерировано FLUX.1