## КОНТЕКСТ И ПРОБЛЕМАТИКА
В последнее время Large Language Models (LLMs) становятся все более интегрированными с графовыми структурами данных, что позволяет использовать их для задач, таких как классификация узлов, где традиционно доминировали Графовые Нейронные Сети (GNNs). Однако, несмотря на высокую эффективность такой интеграции, вопрос их устойчивости к адверсаряльным атакам остается в целом неизученным. Адверсаряльные атаки, которые могут быть направлены как на этап обучения (poisoning attacks), так и на этап тестирования (evasion attacks), представляют значительную угрозу для надежности моделей, особенно в контексте графовых структур.
В данной статье авторы предпринимают первые шаги в изучении уязвимостей графо-ориентированных LLMs, анализируя два представительных модели: LLAGA (Chen et al., 2024) и GRAPHPROMPTER (Liu et al., 2024). Они применяют существующие методы атак, разработанные для графовых моделей, чтобы оценить возможности их использования против LLMs. Кроме того, авторы обнаруживают новую атакованную поверхность для LLAGA, где злоумышленник может внедрять вредоносные узлы в последовательность узлов, что может серьезно понизить качество работы модели.
## ПРЕДЛОЖЕННЫЙ МЕТОД
Авторы используют различные методы адверсаряльных атак, включая такие, которые вносят изменения в структуру графа (poisoning attacks) или во входные данные модели во время тестирования (evasion attacks). Для LLAGA, они используют подход, в котором злоумышленник может добавить вредоносные узлы в последовательность, что приводит к серьезному ухудшению производительности модели. Для GRAPHPROMPTER, которая использует GNN в качестве кодировщика, авторы оценивают ее устойчивость против таких атак.
Кроме того, авторы предлагают новый метод защиты под названием GALGUARD. Этот метод представляет собой комбинацию модуля коррекции функций, основанного на LLMs, и адаптированных методов защиты GNN от структурных атак. GALGUARD предназначен для коррекции возможных внесенных изменений в функциональные параметры и структурные изменения в графе, что позволяет повысить устойчивость модели к атакам.
## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ
Авторы проводят широкий спектр экспериментов, используя различные наборы данных для оценки эффективности предложенных методов атак и защиты. Исследования показывают, что LLAGA более уязвима к атакам, особенно когда злоумышленник может внедрять вредоносные узлы в последовательность. GRAPHPROMPTER, с другой стороны, демонстрирует большую устойчивость, в основном благодаря использованию GNN в качестве кодировщика.
Однако, обе модели остаются уязвимыми к незаметным изменениям в функциональных параметрах, что подтверждает необходимость в дополнительных методах защиты. Результаты экспериментов также показывают, что GALGUARD эффективен в снижении воздействия атак, особенно когда речь идет о структурных изменениях в графе.
## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ
Исследование имеет значительное практическое значение, особенно в контексте безопасности и надежности графо-ориентированных LLMs. Раскрытие уязвимостей и разработка методов защиты, таких как GALGUARD, могут помочь улучшить безопасность моделей в реальных приложениях, где графовые данные играют ключевую роль. Это может быть применимо в таких областях, как анализ социальных сетей, биоинформатика и логистика, где графы широко используются для моделирования сложных систем.
## ВЫВОДЫ И ПЕРСПЕКТИВЫ
В рамках данного исследования были получены важные результаты, которые показывают, что графо-ориентированные LLMs могут быть уязвимы к различным видам адверсаряльных атак. Однако, предложенный метод защиты GALGUARD демонстрирует потенциал для улучшения их устойчивости. Будущие исследования могут фокусироваться на дальнейшем улучшении этих методов защиты и разработке новых подходов для обеспечения безопасности графо-ориентированных LLMs.