Cognitive Linguistic Identity Fusion Score (CLIFS): A Scalable Cognition-Informed Approach to Quantifying Identity Fusion from Text
2509.16813v1
cs.CL, I.2.7; H.3.1; I.5.4; J.4
2025-09-24
Авторы:
Devin R. Wright, Jisun An, Yong-Yeol Ahn
Резюме на русском
## Контекст
Квантификация идентичного сближения — это ключевой вопрос для понимания групповых поведенческих явлений. Идентичное сближение (идентичный фьюз) — это психологический подход, где самость человека сливается с другим субъектом или абстрактным цельным (например, религиозной группой, политической партией, идеологией, ценностью, брендом или верой). Основным подходом к измерению идентичного сближения являются визуальные и текстовые методы, которые требуют управляемых опросов или прямого взаимодействия с исследуемыми. Однако эти методы имеют ограничения в масштабируемости и широком применении, особенно в автоматизированных исследованиях.
## Метод
Мы предлагаем Cognitive Linguistic Identity Fusion Score (CLIFS) — новый метод, который объединяет когнитивную лингвистику с большими языковыми моделями (LLMs). Основа CLIFS — это автоматическое определение имплицитных метафор в тексте. Этот подход предлагает не только детальный анализ, но и масштабируемость. CLIFS не требует прямого взаимодействия с пользователем, что делает его более эффективным по сравнению с традиционными методами. Мы разработали и тестировали CLIFS на основе существующих данных и показали, что он превосходит традиционные автоматизированные методы и традиционные текстовые оценки.
## Результаты
Для проверки CLIFS мы проводили ряд экспериментов, используя текстовые данные, полученные из различных источников, включая социальные медиа, публичные декларации и другие текстовые системы. Мы сравнивали результаты CLIFS с традиционными методами и показали, что CLIFS демонстрирует значительное превосходство в предсказании уровня идентичного сближения. Например, в одном из экспериментов, связанном с оценкой риска насилия, CLIFS улучшил точность прогноза на 240% по сравнению с существующими методами.
## Значимость
CLIFS может быть применен в различных областях, включая оценку риска насилия, мониторинг групповых тенденций и анализ групповых узколобых приверженностей. Одним из основных преимуществ CLIFS является его масштабируемость и автоматизация, что упрощает применение в больших данных и широких исследованиях. Кроме того, CLIFS может быть использован для улучшения ранее существующих моделей оценки риска, таких как модели, основанные на решающих деревьях или глубоких нейронных сетях.
## Выводы
Мы представили новый подход к оценке идентичного сближения, который объединяет когнитивную лингвистику и технологии больших языковых моделей. CLIFS демонстрирует значительное превосходство по сравнению с традиционны
Abstract
Quantifying identity fusion -- the psychological merging of self with another
entity or abstract target (e.g., a religious group, political party, ideology,
value, brand, belief, etc.) -- is vital for understanding a wide range of
group-based human behaviors. We introduce the Cognitive Linguistic Identity
Fusion Score (CLIFS), a novel metric that integrates cognitive linguistics with
large language models (LLMs), which builds on implicit metaphor detection.
Unlike traditional pictorial and verbal scales, which require controlled
surveys or direct field contact, CLIFS delivers fully automated, scalable
assessments while maintaining strong alignment with the established verbal
measure. In benchmarks, CLIFS outperforms both existing automated approaches
and human annotation. As a proof of concept, we apply CLIFS to violence risk
assessment to demonstrate that it can improve violence risk assessment by more
than 240%. Building on our identification of a new NLP task and early success,
we underscore the need to develop larger, more diverse datasets that encompass
additional fusion-target domains and cultural backgrounds to enhance
generalizability and further advance this emerging area. CLIFS models and code
are public at https://github.com/DevinW-sudo/CLIFS.