- Ученые НИЯУ МИФИ создали интеллектуальную систему «Сипуха» для определения голосовых дипфейков.
- Система использует нейронную сеть, обученную на более чем 200 тыс. записей голосов: настоящих и синтезированных.
- Проблема голосовых дипфейков стала особенно острой в последние два года.
- Система может сигнализировать потенциальной жертве о том, что с ней разговаривает синтезированный голос.
- Разработка системы началась в 2022 году, изначально была посвящена задачам голосовой биометрии.
- Нейросеть анализирует кепстральные коэффициенты для определения настоящих и поддельных голосов.
- В России пока нет подобных программ, массово доступных на рынке.
- Система может стать облачным сервисом для определения подлинности голоса в колл-центрах и мессенджерах.
- Технологии клонирования голоса быстро развиваются, «Сипуха» - инструмент, снижающий вероятность успешной атаки.
«Надо понимать, что технологии клонирования голоса быстро развиваются, поэтому «Сипуха» ― не абсолютное оружие против мошенников, а инструмент, который снижает вероятность успешной атаки. Информационные системы можно поделить на два вида: на те, где человек общается с «бездушной» системой (голосовая биометрия, «умный» дом, голосовые помощники, беспилотные автомобили) и те, где пользователи общаются друг с другом (мессенджеры, колл-центры). Прежде всего, мы ориентируемся на колл-центры банков. На базе банков сейчас создаются коммерческие биометрические системы, то есть банки могут использовать голосовую биометрию, чтобы улучшить клиентский опыт. К этим системам можно подключить функцию определения голосовых дипфейков, которая должна практически в реальном времени подсказывать оператору, кто с ним разговаривает: подлинный голос, или цифровой отпечаток голоса клиента, от имени которого мошенники пытаются выполнить операцию», ― рассказал Дмитрий Ефанов.