ENJ: Optimizing Noise with Genetic Algorithms to Jailbreak LSMs

2509.11128v1 cs.SD, cs.AI 2025-09-17
Авторы:

Yibo Zhang, Liang Lin

Резюме на русском

#### Контекст Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся **Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Large Speech Models (LSMs)** обладают высоким значением в области обработки языка, но при этом их безопасность становится все более приоритетной проблемой. Атаки на эти модели могут привести к серьезным последствиям, включая нежелательную раскрытие информации и деформацию смысла. Несмотря на их важность, существуют вызовы в создании эффективных и скрытых атак, которые могут проникнуть через сложные акустические среды. Из-за этого, необходимо развитие более совершенных методов, которые могут безопасно и эффективно протестировать эти модели в разных условиях. #### Метод **Evolutionary Noise Jailbreak (ENJ)** — это метод, который использует **генетический алгоритм** для превращения среднестатистического шума в активно оптимизируемый атакующий вектор, направленный на локальное форсирование LSMs. Основные операции в генетическом процессе включают **инициализацию популяции**, **кроссовер**, и **пробабильную мутацию**. Это позволяет создавать звуковые семплы, которые звучат как гармоничный шум, но содержат в себе скрытую подмену, которая может вызвать трактовку моделем угрожающих команд. Таким образом, ENJ эффективно использует функции шума в своей сути, чтобы превратить его в активное, незаметное для слушателя, средство атаки. #### Результаты **ENJ** протестирован на важных моделях звука, таких как **Wav2Vec 2.0**, **HuBERT**, и **SLU-BERT**, и показал **значительные превосходства** по сравнению с другими методами во всех экспериментах. В частности, **ENJ** показал высокую **эффективность** в проникновении без отклонения видимости, что демонстрирует его мощь в обходе защит. **Эксперименты** были проведены в различных акустических условиях, чтобы продемонстрировать его **универсальность** в разных ситуациях. Эти результаты показывают, что **ENJ** предоставляет новые возможности для безопасного тестирования LSMs в трудных акустических средах. #### Значимость **ENJ** открывает новые горизонты для применения шума в целях повышения безопасности. Он не только обеспечивает **эффективную атаку**, но и **тактическое использование шума**, чтобы выявлять уязвимости в моделях. Это может быть применено во многих **окружениях сложного звука**, таких как в **малом объеме

Abstract

The widespread application of Large Speech Models (LSMs) has made their security risks increasingly prominent. Traditional speech adversarial attack methods face challenges in balancing effectiveness and stealth. This paper proposes Evolutionary Noise Jailbreak (ENJ), which utilizes a genetic algorithm to transform environmental noise from a passive interference into an actively optimizable attack carrier for jailbreaking LSMs. Through operations such as population initialization, crossover fusion, and probabilistic mutation, this method iteratively evolves a series of audio samples that fuse malicious instructions with background noise. These samples sound like harmless noise to humans but can induce the model to parse and execute harmful commands. Extensive experiments on multiple mainstream speech models show that ENJ's attack effectiveness is significantly superior to existing baseline methods. This research reveals the dual role of noise in speech security and provides new critical insights for model security defense in complex acoustic environments.

Ссылки и действия