📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

R. O. Lane, W. J. Holmes, C. J. Taylor, H. M. State-Davey, A. J. Wragge

#### Контекст Многие современные наблюдения показывают, что интернет становится одним из основных средств распространения идеологий, в том числе экстремистских и террористических. Распространение зачастую начинается с незначительных заявлений, которые с дальнейшей четкостью превращаются в громкие пропагандистские призывы. Наряду с этим, власти используют электронные источники для мониторинга подозрительных активностей в онлайн-сообществах. Таким образом, существует необходимость в автоматизированных методах анализа текстов, которые могут помочь распознавать временами неочевидные признаки экстремизма и терроризма на ранней стадии. Однако существуют сложности, такие как отсутствие стандартизированных данных и неоднозначность смысла текста, что необходимо учитывать при разработке таких систем. #### Метод Предложенная система представляет собой комплексное решение, включающее несколько ключевых модулей. Сначала производится онлайн-сбор материалов, включающих заявления, высказанные в онлайн-средах. Затем эти материалы кодируются в виде векторов, используя современные методы машинного обучения, такие как Universal Sentence Encoder (Cer et al., 2018), который выдает 512-мерные векторы для каждого текста. Далее эти векторы используются в качестве входных данных для тренировки модели классификации на основе поддерживающего машинное обучение (SVM) с 10-кратной кросс-валидацией. Также включен модуль мониторинга, позволяющий анализировать изменения в поведении или отношении человека к вопросам, связанным с экстремизмом и терроризмом, на протяжении времени. Затем данные и результаты анализа отображаются в интерактивной визуализации для удобного визуального мониторинга. #### Результаты Проведенные эксперименты показали высокую точность системы в распознавании временами неочевидных признаков экстремизма и терроризма. Модель SVM с данными, полученными с помощью Universal Sentence Encoder, демонстрирует 81% точности в распознавании экстремизма и 97% точности в распознавании терроризма. Это значительно превышает результаты базовой модели, основывающейся на n-граммах текста. Более того, модуль мониторинга сталкивается с рисками неточности в оценке данных за счет шума в исходных данных, но в целом способен отслеживать динамику изменений в отношении человека к экстремизму и терроризму, в зависимости от времени и событий. #### Значимость Предложенная система может иметь широкое применение в различных областях, включая мониторинг онлайн-активности, обнаружение террористической пропаганды и оценку риска экстремизма. Основные преимущества зак
Annotation:
This paper proposes an approach for automatically analysing and tracking statements in material gathered online and detecting whether the authors of the statements are likely to be involved in extremism or terrorism. The proposed system comprises: online collation of statements that are then encoded in a form amenable to machine learning (ML), an ML component to classify the encoded text, a tracker, and a visualisation system for analysis of results. The detection and tracking concept has been t...
ID: 2509.16014v1 cs.LG, cs.CY, I.2.7; I.2.4; G.3; J.4; I.5.1