- Разработана нейросеть MambaShield для защиты от атак отравления-данных в банковской, медицинской и промышленной сферах.
- MambaShield является фундаментом для доверенного искусственного интеллекта, безопасного для использования на атомных станциях и в финансовых организациях.
- Современные ИИ-модели, такие как ChatGPT, уязвимы перед атаками отравления, которые могут изменить логику работы модели и привести к краже информации.
- MambaShield использует селективные модели в пространстве состояний (sSSM), которые способны адаптироваться к входным данным и отфильтровывать злонамеренный шум.
- Даже при отравлении 30% обучающих данных, точность модели MambaShield остается выше 97%.
- Эксперименты показали высокую точность обнаружения вредоносного трафика (99,1%) и быструю работу модели (в 4,2 раза быстрее классического трансформера).
- Работа над MambaShield получила грант от Министерства экономического развития РФ в рамках программы развития центров искусственного интеллекта.
«MambaShield - это не просто очередной алгоритм. Это фундамент для доверенного искусственного интеллекта, который можно устанавливать на атомные станции, в финансовые и медицинские организации, не боясь, что злоумышленник «отравит» обучающую выборку одной хитрой картинкой или пакетом данных», - цитирует пресс-служба авторов разработки.
«Представьте, что вы слушаете разговор в шумном кафе. Обычный ИИ пытается уловить и обработать все звуки сразу: звон ложек, музыку, голоса. MambaShield же фокусируется только на словах нужного собеседника, отфильтровывая злонамеренный шум и атакующие вставки», - пишут авторы