ENJ: Optimizing Noise with Genetic Algorithms to Jailbreak LSMs
2509.11128v1
cs.SD, cs.AI
2025-09-17
Авторы:
Yibo Zhang, Liang Lin
Резюме на русском
#### Контекст
Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся **Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Легко распространяющиеся Large Speech Models (LSMs)** обладают высоким значением в области обработки языка, но при этом их безопасность становится все более приоритетной проблемой. Атаки на эти модели могут привести к серьезным последствиям, включая нежелательную раскрытие информации и деформацию смысла. Несмотря на их важность, существуют вызовы в создании эффективных и скрытых атак, которые могут проникнуть через сложные акустические среды. Из-за этого, необходимо развитие более совершенных методов, которые могут безопасно и эффективно протестировать эти модели в разных условиях.
#### Метод
**Evolutionary Noise Jailbreak (ENJ)** — это метод, который использует **генетический алгоритм** для превращения среднестатистического шума в активно оптимизируемый атакующий вектор, направленный на локальное форсирование LSMs. Основные операции в генетическом процессе включают **инициализацию популяции**, **кроссовер**, и **пробабильную мутацию**. Это позволяет создавать звуковые семплы, которые звучат как гармоничный шум, но содержат в себе скрытую подмену, которая может вызвать трактовку моделем угрожающих команд. Таким образом, ENJ эффективно использует функции шума в своей сути, чтобы превратить его в активное, незаметное для слушателя, средство атаки.
#### Результаты
**ENJ** протестирован на важных моделях звука, таких как **Wav2Vec 2.0**, **HuBERT**, и **SLU-BERT**, и показал **значительные превосходства** по сравнению с другими методами во всех экспериментах. В частности, **ENJ** показал высокую **эффективность** в проникновении без отклонения видимости, что демонстрирует его мощь в обходе защит. **Эксперименты** были проведены в различных акустических условиях, чтобы продемонстрировать его **универсальность** в разных ситуациях. Эти результаты показывают, что **ENJ** предоставляет новые возможности для безопасного тестирования LSMs в трудных акустических средах.
#### Значимость
**ENJ** открывает новые горизонты для применения шума в целях повышения безопасности. Он не только обеспечивает **эффективную атаку**, но и **тактическое использование шума**, чтобы выявлять уязвимости в моделях. Это может быть применено во многих **окружениях сложного звука**, таких как в **малом объеме
Abstract
The widespread application of Large Speech Models (LSMs) has made their
security risks increasingly prominent. Traditional speech adversarial attack
methods face challenges in balancing effectiveness and stealth. This paper
proposes Evolutionary Noise Jailbreak (ENJ), which utilizes a genetic algorithm
to transform environmental noise from a passive interference into an actively
optimizable attack carrier for jailbreaking LSMs. Through operations such as
population initialization, crossover fusion, and probabilistic mutation, this
method iteratively evolves a series of audio samples that fuse malicious
instructions with background noise. These samples sound like harmless noise to
humans but can induce the model to parse and execute harmful commands.
Extensive experiments on multiple mainstream speech models show that ENJ's
attack effectiveness is significantly superior to existing baseline methods.
This research reveals the dual role of noise in speech security and provides
new critical insights for model security defense in complex acoustic
environments.
Ссылки и действия
Дополнительные ресурсы: