SABIA: An AI-Powered Tool for Detecting Opioid-Related Behaviors on Social Media
2508.10046v1
cs.SI, cs.AI
2025-08-15
Авторы:
Muhammad Ahmad, Fida Ullah, Muhammad Usman, Ildar Batyrshin, Grigori Sidorov
Резюме на русском
## Контекст
Социальные медиа представляют собой ценный инструмент для изучения общественных здравоохранных проблем, позволяя понять поведение пациентов, использование лекарств и проблемы психического здоровья. Однако анализ таких данных сложнее, чем кажется, из-за широкого использования неформального языка, сленга и кодированного общения, которые могут затруднить выявление наркотической зависимости. Это исследование сосредоточено на выявлении поведения пользователей, связанного с опиоидами в социальных медиа, включая неформальные выражения, сленг и неточную правописание.
## Метод
Методология SABIA базируется на сочетании Bidirectional Encoder Representations from Transformers (BERT) с BiLSTM и 3-CNN для создания усовершенствованного гибридного нейросетевого моделирования. Она включает несколько ключевых этапов:
1. **Предварительная обработка данных**, например, синонимизация, удаление стоп-слов и нормализация.
2. **Представление данных** с помощью BERT-BiLSTM-3CNN для извлечения семантических и контекстуальных признаков.
3. **Обучение модели** с помощью конфигурации Fine-Tuning для лучшей точности классификации.
4. **Классификация поведения пользователей** в 5 классов: Dealers, Active Opioid Users, Recovered Users, Prescription Users и Non-Users.
Архитектура SABIA построена на адаптивных расчетах, которые позволяют модели понимать контекст и сложности сленга, связанного с опиоидами.
## Результаты
Для тестирования SABIA использовался настраиваемый датасет, состоящий из постов Reddit. На этапе классификации SABIA показала следующие результаты:
- **Precision**: 0.85
- **Recall**: 0.84
- **F1-score**: 0.84
- **Accuracy**: 0.93
Эти показатели значительно превышают показатели базового моделирования (Logistic Regression, LR=0.86). Сравнение SABIA со семьями других моделей подтвердило её эффективность и высокую точность в локализации поведения пользователей.
## Значимость
SABIA может быть применена в различных сферах, включая здравоохранение, мониторнг социальных медиа и психологический анализ. Основные преимущества:
- Улучшенная точность классификации.
- Усовершенствованная возможность обнаружения контекстуальных признаков.
- Помощь в мониторинге здоровья и реагировании на наркотическую зависимость.
## Выводы
SABIA демонстрирует мощь гибридных нейросетевых моделей в выявлении сложных поведенческих моделей на социальных медиа. Дальнейшие работы будут сосредоточены на усовершенствовании модели для обнаружения других типов зависимостей и расширении её применения в здравоохранении.
Abstract
Social media platforms have become valuable tools for understanding public
health challenges by offering insights into patient behaviors, medication use,
and mental health issues. However, analyzing such data remains difficult due to
the prevalence of informal language, slang, and coded communication, which can
obscure the detection of opioid misuse. This study addresses the issue of
opioid-related user behavior on social media, including informal expressions,
slang terms, and misspelled or coded language. We analyzed the existing
Bidirectional Encoder Representations from Transformers (BERT) technique and
developed a BERT-BiLSTM-3CNN hybrid deep learning model, named SABIA, to create
a single-task classifier that effectively captures the features of the target
dataset. The SABIA model demonstrated strong capabilities in capturing
semantics and contextual information. The proposed approach includes: (1) data
preprocessing, (2) data representation using the SABIA model, (3) a fine-tuning
phase, and (4) classification of user behavior into five categories. A new
dataset was constructed from Reddit posts, identifying opioid user behaviors
across five classes: Dealers, Active Opioid Users, Recovered Users,
Prescription Users, and Non-Users, supported by detailed annotation guidelines.
Experiments were conducted using supervised learning. Results show that SABIA
achieved benchmark performance, outperforming the baseline (Logistic
Regression, LR = 0.86) and improving accuracy by 9.30%. Comparisons with seven
previous studies confirmed its effectiveness and robustness. This study
demonstrates the potential of hybrid deep learning models for detecting complex
opioid-related behaviors on social media, supporting public health monitoring
and intervention efforts.
Ссылки и действия
Дополнительные ресурсы: