Cognitive Surgery: The Awakening of Implicit Territorial Awareness in LLMs

2508.14408v1 cs.CL, cs.AI 2025-08-22

Авторы:

Yinghan Zhou, Weifeng Zhu, Juan Wen, Wanli Peng, Zhengxian Wu, Yiming Xue

Резюме на русском

## Контекст Large Language Models (LLMs) — высокоскоростные и мощные инструменты для обработки текстов, но их работа всё еще остается неизящной, особенно в задачах, требующих осознания собственного текста. Одной из таких задач является определение того, является ли заданный текст самостоятельно сгенерированным моделью. Несмотря на то, что LLMs показали успех в этой задаче при использовании Pair Presentation Paradigm (PPP), в ситуации Individual Presentation Paradigm (IPP) их показатели снижаются довольно существенно. Эта проблема может быть связана с недостаточной развитостью внутреннего восприятия текстов, которое в научной литературе обозначено как Implicit Territorial Awareness (ITA). Наша работа направлена на исследование этой проблемы и поиск способа исправить этот недостаток, чтобы улучшить возможности LLMs в IPP. ## Метод Мы предлагаем метод, названный Cognitive Surgery (CoSur), который включает в себя следующие модули: **representation extraction**, **territory construction**, **authorship discrimination** и **cognitive editing**. Модуль **representation extraction** отвечает за извлечение характеристик текстов, а **territory construction** — за создание специфического пространства, в котором можно отличить тексты, сгенерированные моделью и тексты, сгенерированные другими источниками. Используя **authorship discrimination**, мы проводим авторское определение, а **cognitive editing** позволяет модели самоулучшаться в процессе работы. Наша архитектура поддерживает эффективное повышение точности в IPP-сценарии. ## Результаты Мы провели эксперименты, используя три разных модели LLM, и сравнили их результаты с использованием нашего метода CoSur. Результаты показали, что наша методика улучшает производительность LLMs в IPP-сценарии, достигнув следующих результатов: модель 1 — 83.25%, модель 2 — 66.19%, модель 3 — 88.01%. Эти результаты показывают, что CoSur повышает точность определения, что делает решение более надежным и эффективным. ## Значимость Наша работа имеет значительное значение в области применения моделей текстового понимания. Улучшенная возможность определения авторства может пригодиться в различных приложениях, таких как детекция поддельности текстов, анализ авторских стилей, автоматизированные системы обработки текстов и другие. CoSur не только улучшает выполнение конкретной задачи но и демонстрирует потенциал для дальнейшего исследования творческого поведения моделей текстового понимания. ## Выводы Выводы нашей работы заключаются в следующем: мы успешно показали, что Implicit Territorial Awareness может быть "пробуждена" в LLMs с помощью CoSur. Это не только улучшает производительность моделей в IPP, но и открывает пути для дальнейшего исследования возможностей LLMs в задачах текстового понимания. Мы планируем продолжить работу над улучшением нашей методики и её при

Abstract

Large language models (LLMs) have been shown to possess a degree of self-recognition capability-the ability to identify whether a given text was generated by themselves. Prior work has demonstrated that this capability is reliably expressed under the Pair Presentation Paradigm (PPP), where the model is presented with two texts and asked to choose which one it authored. However, performance deteriorates sharply under the Individual Presentation Paradigm (IPP), where the model is given a single text to judge authorship. Although this phenomenon has been observed, its underlying causes have not been systematically analyzed. In this paper, we first replicate existing findings to confirm that LLMs struggle to distinguish self- from other-generated text under IPP. We then investigate the reasons for this failure and attribute it to a phenomenon we term Implicit Territorial Awareness (ITA)-the model's latent ability to distinguish self- and other-texts in representational space, which remains unexpressed in its output behavior. To awaken the ITA of LLMs, we propose Cognitive Surgery (CoSur), a novel framework comprising four main modules: representation extraction, territory construction, authorship discrimination and cognitive editing. Experimental results demonstrate that our proposed method improves the performance of three different LLMs in the IPP scenario, achieving average accuracies of 83.25%, 66.19%, and 88.01%, respectively.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Cognitive Surgery: The Awakening of Implicit Territorial Awareness in LLMs

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

UW-BioNLP at ChemoTimelines 2025: Thinking, Fine-Tuning, and Dictionary-Enhanced...

AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees

SignRoundV2: Closing the Performance Gap in Extremely Low-Bit Post-Training Quan...

Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Sou...

SEAL: Self-Evolving Agentic Learning for Conversational Question Answering over ...

Навигация