SABIA: An AI-Powered Tool for Detecting Opioid-Related Behaviors on Social Media

2508.10046v1 cs.SI, cs.AI 2025-08-15
Авторы:

Muhammad Ahmad, Fida Ullah, Muhammad Usman, Ildar Batyrshin, Grigori Sidorov

Резюме на русском

## Контекст Социальные медиа представляют собой ценный инструмент для изучения общественных здравоохранных проблем, позволяя понять поведение пациентов, использование лекарств и проблемы психического здоровья. Однако анализ таких данных сложнее, чем кажется, из-за широкого использования неформального языка, сленга и кодированного общения, которые могут затруднить выявление наркотической зависимости. Это исследование сосредоточено на выявлении поведения пользователей, связанного с опиоидами в социальных медиа, включая неформальные выражения, сленг и неточную правописание. ## Метод Методология SABIA базируется на сочетании Bidirectional Encoder Representations from Transformers (BERT) с BiLSTM и 3-CNN для создания усовершенствованного гибридного нейросетевого моделирования. Она включает несколько ключевых этапов: 1. **Предварительная обработка данных**, например, синонимизация, удаление стоп-слов и нормализация. 2. **Представление данных** с помощью BERT-BiLSTM-3CNN для извлечения семантических и контекстуальных признаков. 3. **Обучение модели** с помощью конфигурации Fine-Tuning для лучшей точности классификации. 4. **Классификация поведения пользователей** в 5 классов: Dealers, Active Opioid Users, Recovered Users, Prescription Users и Non-Users. Архитектура SABIA построена на адаптивных расчетах, которые позволяют модели понимать контекст и сложности сленга, связанного с опиоидами. ## Результаты Для тестирования SABIA использовался настраиваемый датасет, состоящий из постов Reddit. На этапе классификации SABIA показала следующие результаты: - **Precision**: 0.85 - **Recall**: 0.84 - **F1-score**: 0.84 - **Accuracy**: 0.93 Эти показатели значительно превышают показатели базового моделирования (Logistic Regression, LR=0.86). Сравнение SABIA со семьями других моделей подтвердило её эффективность и высокую точность в локализации поведения пользователей. ## Значимость SABIA может быть применена в различных сферах, включая здравоохранение, мониторнг социальных медиа и психологический анализ. Основные преимущества: - Улучшенная точность классификации. - Усовершенствованная возможность обнаружения контекстуальных признаков. - Помощь в мониторинге здоровья и реагировании на наркотическую зависимость. ## Выводы SABIA демонстрирует мощь гибридных нейросетевых моделей в выявлении сложных поведенческих моделей на социальных медиа. Дальнейшие работы будут сосредоточены на усовершенствовании модели для обнаружения других типов зависимостей и расширении её применения в здравоохранении.

Abstract

Social media platforms have become valuable tools for understanding public health challenges by offering insights into patient behaviors, medication use, and mental health issues. However, analyzing such data remains difficult due to the prevalence of informal language, slang, and coded communication, which can obscure the detection of opioid misuse. This study addresses the issue of opioid-related user behavior on social media, including informal expressions, slang terms, and misspelled or coded language. We analyzed the existing Bidirectional Encoder Representations from Transformers (BERT) technique and developed a BERT-BiLSTM-3CNN hybrid deep learning model, named SABIA, to create a single-task classifier that effectively captures the features of the target dataset. The SABIA model demonstrated strong capabilities in capturing semantics and contextual information. The proposed approach includes: (1) data preprocessing, (2) data representation using the SABIA model, (3) a fine-tuning phase, and (4) classification of user behavior into five categories. A new dataset was constructed from Reddit posts, identifying opioid user behaviors across five classes: Dealers, Active Opioid Users, Recovered Users, Prescription Users, and Non-Users, supported by detailed annotation guidelines. Experiments were conducted using supervised learning. Results show that SABIA achieved benchmark performance, outperforming the baseline (Logistic Regression, LR = 0.86) and improving accuracy by 9.30%. Comparisons with seven previous studies confirmed its effectiveness and robustness. This study demonstrates the potential of hybrid deep learning models for detecting complex opioid-related behaviors on social media, supporting public health monitoring and intervention efforts.

Ссылки и действия