Context Matters: Incorporating Target Awareness in Conversational Abusive Language Detection

2508.12828v1 cs.CL, cs.AI 2025-08-20
Авторы:

Raneem Alharthi, Rajwa Alharthi, Aiqi Jiang, Arkaitz Zubiaga

Резюме на русском

## Контекст Абузивный язык в социальных сетях является важной проблемой, которая сказывается на удовлетворении пользователей и здоровье общества. Несмотря на развитие моделей для определения абузивного языка, большая часть исследований ограничивается использованием отдельных сообщений без учета контекста, в котором они появляются. Данное исследование фокусируется на обменах в контексте диалогов, где пользователь отвечает на сообщение другого пользователя (родительское сообщение). Основный вопрос: улучшает ли использование контекста родительского сообщения точность определения абузивного языка, и какие функции в нем играют наиболее важную роль? ## Метод Исследование основывается на множественных моделях классификации для определения абузивности сообщений в контексте. Модели работают с двумя типами данных: отдельные сообщения (родительские и ответные) и пары родительских и ответных сообщений. Используются различные типы функций: контентные (содержание сообщения) и аккаунтные (данные пользователя). Эксперименты проводятся на небольшом, но применимом датасете, содержащем пары родительских и ответных сообщений, классифицированных как абузивные или неабузивные. Модели сравниваются по их точности и способности включать контекстную информацию. ## Результаты Исследования показали, что использование контекстной информации существенно повышает точность классификации. Методы, использующие контентные функции, показали лучшие результаты по сравнению с аккаунтными функциями. Также было замечено, что лучшая точность достигается при использовании разнообразия функций, а не при ограниченном выборе. Эта находка подтверждает важность контекста в моделях определения абузивного языка, особенно в контексте диалогов в социальных сетях. ## Значимость Результаты могут быть применены в разработке моделей для мониторинга социальных сетей и принятия решений о том, следует ли принять меры против пользователей, которые ведут себя абузивно. Данный подход также может быть применен для изучения других видов контекстной оценки в социальных сетях, повышая актуальность моделей в реальных условиях. ## Выводы Резюмируя, исследование подтвердило, что контекст родительского сообщения может значительно повысить точность определения абузивного языка в социальных сетях. Особенно важным оказалось использование разнообразных контентных функций. Будущие исследования будут ориентированы на улучшение моделей для более больших датасетов и учитывать другие факторы, такие как история поведения пользователей или их аудитории.

Abstract

Abusive language detection has become an increasingly important task as a means to tackle this type of harmful content in social media. There has been a substantial body of research developing models for determining if a social media post is abusive or not; however, this research has primarily focused on exploiting social media posts individually, overlooking additional context that can be derived from surrounding posts. In this study, we look at conversational exchanges, where a user replies to an earlier post by another user (the parent tweet). We ask: does leveraging context from the parent tweet help determine if a reply post is abusive or not, and what are the features that contribute the most? We study a range of content-based and account-based features derived from the context, and compare this to the more widely studied approach of only looking at the features from the reply tweet. For a more generalizable study, we test four different classification models on a dataset made of conversational exchanges (parent-reply tweet pairs) with replies labeled as abusive or not. Our experiments show that incorporating contextual features leads to substantial improvements compared to the use of features derived from the reply tweet only, confirming the importance of leveraging context. We observe that, among the features under study, it is especially the content-based features (what is being posted) that contribute to the classification performance rather than account-based features (who is posting it). While using content-based features, it is best to combine a range of different features to ensure improved performance over being more selective and using fewer features. Our study provides insights into the development of contextualized abusive language detection models in realistic settings involving conversations.

Ссылки и действия