Cognitive Linguistic Identity Fusion Score (CLIFS): A Scalable Cognition-Informed Approach to Quantifying Identity Fusion from Text

2509.16813v1 cs.CL, I.2.7; H.3.1; I.5.4; J.4 2025-09-24
Авторы:

Devin R. Wright, Jisun An, Yong-Yeol Ahn

Резюме на русском

## Контекст Квантификация идентичного сближения — это ключевой вопрос для понимания групповых поведенческих явлений. Идентичное сближение (идентичный фьюз) — это психологический подход, где самость человека сливается с другим субъектом или абстрактным цельным (например, религиозной группой, политической партией, идеологией, ценностью, брендом или верой). Основным подходом к измерению идентичного сближения являются визуальные и текстовые методы, которые требуют управляемых опросов или прямого взаимодействия с исследуемыми. Однако эти методы имеют ограничения в масштабируемости и широком применении, особенно в автоматизированных исследованиях. ## Метод Мы предлагаем Cognitive Linguistic Identity Fusion Score (CLIFS) — новый метод, который объединяет когнитивную лингвистику с большими языковыми моделями (LLMs). Основа CLIFS — это автоматическое определение имплицитных метафор в тексте. Этот подход предлагает не только детальный анализ, но и масштабируемость. CLIFS не требует прямого взаимодействия с пользователем, что делает его более эффективным по сравнению с традиционными методами. Мы разработали и тестировали CLIFS на основе существующих данных и показали, что он превосходит традиционные автоматизированные методы и традиционные текстовые оценки. ## Результаты Для проверки CLIFS мы проводили ряд экспериментов, используя текстовые данные, полученные из различных источников, включая социальные медиа, публичные декларации и другие текстовые системы. Мы сравнивали результаты CLIFS с традиционными методами и показали, что CLIFS демонстрирует значительное превосходство в предсказании уровня идентичного сближения. Например, в одном из экспериментов, связанном с оценкой риска насилия, CLIFS улучшил точность прогноза на 240% по сравнению с существующими методами. ## Значимость CLIFS может быть применен в различных областях, включая оценку риска насилия, мониторинг групповых тенденций и анализ групповых узколобых приверженностей. Одним из основных преимуществ CLIFS является его масштабируемость и автоматизация, что упрощает применение в больших данных и широких исследованиях. Кроме того, CLIFS может быть использован для улучшения ранее существующих моделей оценки риска, таких как модели, основанные на решающих деревьях или глубоких нейронных сетях. ## Выводы Мы представили новый подход к оценке идентичного сближения, который объединяет когнитивную лингвистику и технологии больших языковых моделей. CLIFS демонстрирует значительное превосходство по сравнению с традиционны

Abstract

Quantifying identity fusion -- the psychological merging of self with another entity or abstract target (e.g., a religious group, political party, ideology, value, brand, belief, etc.) -- is vital for understanding a wide range of group-based human behaviors. We introduce the Cognitive Linguistic Identity Fusion Score (CLIFS), a novel metric that integrates cognitive linguistics with large language models (LLMs), which builds on implicit metaphor detection. Unlike traditional pictorial and verbal scales, which require controlled surveys or direct field contact, CLIFS delivers fully automated, scalable assessments while maintaining strong alignment with the established verbal measure. In benchmarks, CLIFS outperforms both existing automated approaches and human annotation. As a proof of concept, we apply CLIFS to violence risk assessment to demonstrate that it can improve violence risk assessment by more than 240%. Building on our identification of a new NLP task and early success, we underscore the need to develop larger, more diverse datasets that encompass additional fusion-target domains and cultural backgrounds to enhance generalizability and further advance this emerging area. CLIFS models and code are public at https://github.com/DevinW-sudo/CLIFS.

Ссылки и действия