Mental Multi-class Classification on Social Media: Benchmarking Transformer Architectures against LSTM Models

2509.16542v1 cs.CL, cs.IR, cs.LG 2025-09-24
Авторы:

Khalid Hasan, Jamil Saquer, Yifan Zhang

Резюме на русском

#### Контекст Социальные медиа становятся важной платформой для открытия о личных борьбах с психологическими расстройствами. Это способствует раннему выявлению заболеваний, таких как депрессия и биполярное расстройство. Однако большинство исследований в области NLP ограничиваются одно-масштабным распознаванием расстройств. Для понимания мощности усовершенствованных методов NLP в многоклассовом классификационном задании, включающем несколько расстройств, необходимо проведение широкомасштабных экспериментов. #### Метод Для тестирования была сформирована база данных со статьями из Reddit, охватывающих шесть классов психологических расстройств, а также контрольную группу. Данные были тщательно подготовлены с применением статистического анализа и фильтрации для повышения качества аннотаций. Исследование включало сравнение ряда моделей на основе трансформеров (BERT, RoBERTa, DistilBERT, ALBERT, ELECTRA) и вариантов LSTM с использованием разных вариантов входных данных и архитектур. #### Результаты В ходе экспериментов было показано, что трансформеры в большинстве случаев превосходят LSTM-модели. Модель RoBERTa показала наивысшие показатели F1-меры и точности классификации, достигая 91–99% на всех классах. Особого внимания заслуживают LSTM-модели с аугментацией аттенцией и BERT-входными данными, которые показали почти одинаковые результаты с трансформерами, при этом обучались до 3.5 раз быстрее. Модели с использованием статических эмбеддингов, в свою очередь, становились менее эффективными. #### Значимость Результаты этих исследований могут использоваться в области раннего выявления питаний на социальных сетях, повышению эффективности медицинских систем и психологического консультирования. Особенно важным является то, что модели трансформеров представляют собой лучшую альтернативу для многоклассовой классификации психологических расстройств, учитывая свои более высокие показатели точности. #### Выводы В ходе работы было установлено, что трансформеры, в частности RoBERTa, являются лучшими выборами для задач многоклассовой классификации психологических расстройств. Будущие работы будут направлены на улучшение эффективности трансформеров для деплоя в реальных приложениях, например, в рамках более низких ресурсов и более высокой скорости выполнения.

Abstract

Millions of people openly share mental health struggles on social media, providing rich data for early detection of conditions such as depression, bipolar disorder, etc. However, most prior Natural Language Processing (NLP) research has focused on single-disorder identification, leaving a gap in understanding the efficacy of advanced NLP techniques for distinguishing among multiple mental health conditions. In this work, we present a large-scale comparative study of state-of-the-art transformer versus Long Short-Term Memory (LSTM)-based models to classify mental health posts into exclusive categories of mental health conditions. We first curate a large dataset of Reddit posts spanning six mental health conditions and a control group, using rigorous filtering and statistical exploratory analysis to ensure annotation quality. We then evaluate five transformer architectures (BERT, RoBERTa, DistilBERT, ALBERT, and ELECTRA) against several LSTM variants (with or without attention, using contextual or static embeddings) under identical conditions. Experimental results show that transformer models consistently outperform the alternatives, with RoBERTa achieving 91-99% F1-scores and accuracies across all classes. Notably, attention-augmented LSTMs with BERT embeddings approach transformer performance (up to 97% F1-score) while training 2-3.5 times faster, whereas LSTMs using static embeddings fail to learn useful signals. These findings represent the first comprehensive benchmark for multi-class mental health detection, offering practical guidance on model selection and highlighting an accuracy-efficiency trade-off for real-world deployment of mental health NLP systems.

Ссылки и действия

Связанные статьи

Are Smaller Open-Weight LLMs Closing the Gap to Proprietary Models for Biomedica...

#### Контекст Открытые версии больших языковых моделей (LLMs) постоянно совершают значительные прорывы в области ИИ. Наи...

2025-09-25

mmBERT: A Modern Multilingual Encoder with Annealed Language Learning

## Контекст В настоящее время современные модели языкового представления, такие как BERT, широко используются для решен...

2025-09-10