Predicting the descent into extremism and terrorism
2509.16014v1
cs.LG, cs.CY, I.2.7; I.2.4; G.3; J.4; I.5.1
2025-09-23
Авторы:
R. O. Lane, W. J. Holmes, C. J. Taylor, H. M. State-Davey, A. J. Wragge
Резюме на русском
#### Контекст
Многие современные наблюдения показывают, что интернет становится одним из основных средств распространения идеологий, в том числе экстремистских и террористических. Распространение зачастую начинается с незначительных заявлений, которые с дальнейшей четкостью превращаются в громкие пропагандистские призывы. Наряду с этим, власти используют электронные источники для мониторинга подозрительных активностей в онлайн-сообществах. Таким образом, существует необходимость в автоматизированных методах анализа текстов, которые могут помочь распознавать временами неочевидные признаки экстремизма и терроризма на ранней стадии. Однако существуют сложности, такие как отсутствие стандартизированных данных и неоднозначность смысла текста, что необходимо учитывать при разработке таких систем.
#### Метод
Предложенная система представляет собой комплексное решение, включающее несколько ключевых модулей. Сначала производится онлайн-сбор материалов, включающих заявления, высказанные в онлайн-средах. Затем эти материалы кодируются в виде векторов, используя современные методы машинного обучения, такие как Universal Sentence Encoder (Cer et al., 2018), который выдает 512-мерные векторы для каждого текста. Далее эти векторы используются в качестве входных данных для тренировки модели классификации на основе поддерживающего машинное обучение (SVM) с 10-кратной кросс-валидацией. Также включен модуль мониторинга, позволяющий анализировать изменения в поведении или отношении человека к вопросам, связанным с экстремизмом и терроризмом, на протяжении времени. Затем данные и результаты анализа отображаются в интерактивной визуализации для удобного визуального мониторинга.
#### Результаты
Проведенные эксперименты показали высокую точность системы в распознавании временами неочевидных признаков экстремизма и терроризма. Модель SVM с данными, полученными с помощью Universal Sentence Encoder, демонстрирует 81% точности в распознавании экстремизма и 97% точности в распознавании терроризма. Это значительно превышает результаты базовой модели, основывающейся на n-граммах текста. Более того, модуль мониторинга сталкивается с рисками неточности в оценке данных за счет шума в исходных данных, но в целом способен отслеживать динамику изменений в отношении человека к экстремизму и терроризму, в зависимости от времени и событий.
#### Значимость
Предложенная система может иметь широкое применение в различных областях, включая мониторинг онлайн-активности, обнаружение террористической пропаганды и оценку риска экстремизма. Основные преимущества зак
Abstract
This paper proposes an approach for automatically analysing and tracking
statements in material gathered online and detecting whether the authors of the
statements are likely to be involved in extremism or terrorism. The proposed
system comprises: online collation of statements that are then encoded in a
form amenable to machine learning (ML), an ML component to classify the encoded
text, a tracker, and a visualisation system for analysis of results. The
detection and tracking concept has been tested using quotes made by terrorists,
extremists, campaigners, and politicians, obtained from wikiquote.org. A set of
features was extracted for each quote using the state-of-the-art Universal
Sentence Encoder (Cer et al. 2018), which produces 512-dimensional vectors. The
data were used to train and test a support vector machine (SVM) classifier
using 10-fold cross-validation. The system was able to correctly detect
intentions and attitudes associated with extremism 81% of the time and
terrorism 97% of the time, using a dataset of 839 quotes. This accuracy was
higher than that which was achieved for a simple baseline system based on
n-gram text features. Tracking techniques were also used to perform a temporal
analysis of the data, with each quote considered to be a noisy measurement of a
person's state of mind. It was demonstrated that the tracking algorithms were
able to detect both trends over time and sharp changes in attitude that could
be attributed to major events.