Predicting the descent into extremism and terrorism

2509.16014v1 cs.LG, cs.CY, I.2.7; I.2.4; G.3; J.4; I.5.1 2025-09-23

Авторы:

R. O. Lane, W. J. Holmes, C. J. Taylor, H. M. State-Davey, A. J. Wragge

Резюме на русском

#### Контекст Многие современные наблюдения показывают, что интернет становится одним из основных средств распространения идеологий, в том числе экстремистских и террористических. Распространение зачастую начинается с незначительных заявлений, которые с дальнейшей четкостью превращаются в громкие пропагандистские призывы. Наряду с этим, власти используют электронные источники для мониторинга подозрительных активностей в онлайн-сообществах. Таким образом, существует необходимость в автоматизированных методах анализа текстов, которые могут помочь распознавать временами неочевидные признаки экстремизма и терроризма на ранней стадии. Однако существуют сложности, такие как отсутствие стандартизированных данных и неоднозначность смысла текста, что необходимо учитывать при разработке таких систем. #### Метод Предложенная система представляет собой комплексное решение, включающее несколько ключевых модулей. Сначала производится онлайн-сбор материалов, включающих заявления, высказанные в онлайн-средах. Затем эти материалы кодируются в виде векторов, используя современные методы машинного обучения, такие как Universal Sentence Encoder (Cer et al., 2018), который выдает 512-мерные векторы для каждого текста. Далее эти векторы используются в качестве входных данных для тренировки модели классификации на основе поддерживающего машинное обучение (SVM) с 10-кратной кросс-валидацией. Также включен модуль мониторинга, позволяющий анализировать изменения в поведении или отношении человека к вопросам, связанным с экстремизмом и терроризмом, на протяжении времени. Затем данные и результаты анализа отображаются в интерактивной визуализации для удобного визуального мониторинга. #### Результаты Проведенные эксперименты показали высокую точность системы в распознавании временами неочевидных признаков экстремизма и терроризма. Модель SVM с данными, полученными с помощью Universal Sentence Encoder, демонстрирует 81% точности в распознавании экстремизма и 97% точности в распознавании терроризма. Это значительно превышает результаты базовой модели, основывающейся на n-граммах текста. Более того, модуль мониторинга сталкивается с рисками неточности в оценке данных за счет шума в исходных данных, но в целом способен отслеживать динамику изменений в отношении человека к экстремизму и терроризму, в зависимости от времени и событий. #### Значимость Предложенная система может иметь широкое применение в различных областях, включая мониторинг онлайн-активности, обнаружение террористической пропаганды и оценку риска экстремизма. Основные преимущества зак

Abstract

This paper proposes an approach for automatically analysing and tracking statements in material gathered online and detecting whether the authors of the statements are likely to be involved in extremism or terrorism. The proposed system comprises: online collation of statements that are then encoded in a form amenable to machine learning (ML), an ML component to classify the encoded text, a tracker, and a visualisation system for analysis of results. The detection and tracking concept has been tested using quotes made by terrorists, extremists, campaigners, and politicians, obtained from wikiquote.org. A set of features was extracted for each quote using the state-of-the-art Universal Sentence Encoder (Cer et al. 2018), which produces 512-dimensional vectors. The data were used to train and test a support vector machine (SVM) classifier using 10-fold cross-validation. The system was able to correctly detect intentions and attitudes associated with extremism 81% of the time and terrorism 97% of the time, using a dataset of 839 quotes. This accuracy was higher than that which was achieved for a simple baseline system based on n-gram text features. Tracking techniques were also used to perform a temporal analysis of the data, with each quote considered to be a noisy measurement of a person's state of mind. It was demonstrated that the tracking algorithms were able to detect both trends over time and sharp changes in attitude that could be attributed to major events.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Резюме на русском

Abstract

Ссылки и действия

Навигация