Context Matters: Incorporating Target Awareness in Conversational Abusive Language Detection
2508.12828v1
cs.CL, cs.AI
2025-08-20
Авторы:
Raneem Alharthi, Rajwa Alharthi, Aiqi Jiang, Arkaitz Zubiaga
Резюме на русском
## Контекст
Абузивный язык в социальных сетях является важной проблемой, которая сказывается на удовлетворении пользователей и здоровье общества. Несмотря на развитие моделей для определения абузивного языка, большая часть исследований ограничивается использованием отдельных сообщений без учета контекста, в котором они появляются. Данное исследование фокусируется на обменах в контексте диалогов, где пользователь отвечает на сообщение другого пользователя (родительское сообщение). Основный вопрос: улучшает ли использование контекста родительского сообщения точность определения абузивного языка, и какие функции в нем играют наиболее важную роль?
## Метод
Исследование основывается на множественных моделях классификации для определения абузивности сообщений в контексте. Модели работают с двумя типами данных: отдельные сообщения (родительские и ответные) и пары родительских и ответных сообщений. Используются различные типы функций: контентные (содержание сообщения) и аккаунтные (данные пользователя). Эксперименты проводятся на небольшом, но применимом датасете, содержащем пары родительских и ответных сообщений, классифицированных как абузивные или неабузивные. Модели сравниваются по их точности и способности включать контекстную информацию.
## Результаты
Исследования показали, что использование контекстной информации существенно повышает точность классификации. Методы, использующие контентные функции, показали лучшие результаты по сравнению с аккаунтными функциями. Также было замечено, что лучшая точность достигается при использовании разнообразия функций, а не при ограниченном выборе. Эта находка подтверждает важность контекста в моделях определения абузивного языка, особенно в контексте диалогов в социальных сетях.
## Значимость
Результаты могут быть применены в разработке моделей для мониторинга социальных сетей и принятия решений о том, следует ли принять меры против пользователей, которые ведут себя абузивно. Данный подход также может быть применен для изучения других видов контекстной оценки в социальных сетях, повышая актуальность моделей в реальных условиях.
## Выводы
Резюмируя, исследование подтвердило, что контекст родительского сообщения может значительно повысить точность определения абузивного языка в социальных сетях. Особенно важным оказалось использование разнообразных контентных функций. Будущие исследования будут ориентированы на улучшение моделей для более больших датасетов и учитывать другие факторы, такие как история поведения пользователей или их аудитории.
Abstract
Abusive language detection has become an increasingly important task as a
means to tackle this type of harmful content in social media. There has been a
substantial body of research developing models for determining if a social
media post is abusive or not; however, this research has primarily focused on
exploiting social media posts individually, overlooking additional context that
can be derived from surrounding posts. In this study, we look at conversational
exchanges, where a user replies to an earlier post by another user (the parent
tweet). We ask: does leveraging context from the parent tweet help determine if
a reply post is abusive or not, and what are the features that contribute the
most? We study a range of content-based and account-based features derived from
the context, and compare this to the more widely studied approach of only
looking at the features from the reply tweet. For a more generalizable study,
we test four different classification models on a dataset made of
conversational exchanges (parent-reply tweet pairs) with replies labeled as
abusive or not. Our experiments show that incorporating contextual features
leads to substantial improvements compared to the use of features derived from
the reply tweet only, confirming the importance of leveraging context. We
observe that, among the features under study, it is especially the
content-based features (what is being posted) that contribute to the
classification performance rather than account-based features (who is posting
it). While using content-based features, it is best to combine a range of
different features to ensure improved performance over being more selective and
using fewer features. Our study provides insights into the development of
contextualized abusive language detection models in realistic settings
involving conversations.
Ссылки и действия
Дополнительные ресурсы: