Cognitive Surgery: The Awakening of Implicit Territorial Awareness in LLMs
2508.14408v1
cs.CL, cs.AI
2025-08-22
Авторы:
Yinghan Zhou, Weifeng Zhu, Juan Wen, Wanli Peng, Zhengxian Wu, Yiming Xue
Резюме на русском
## Контекст
Large Language Models (LLMs) — высокоскоростные и мощные инструменты для обработки текстов, но их работа всё еще остается неизящной, особенно в задачах, требующих осознания собственного текста. Одной из таких задач является определение того, является ли заданный текст самостоятельно сгенерированным моделью. Несмотря на то, что LLMs показали успех в этой задаче при использовании Pair Presentation Paradigm (PPP), в ситуации Individual Presentation Paradigm (IPP) их показатели снижаются довольно существенно. Эта проблема может быть связана с недостаточной развитостью внутреннего восприятия текстов, которое в научной литературе обозначено как Implicit Territorial Awareness (ITA). Наша работа направлена на исследование этой проблемы и поиск способа исправить этот недостаток, чтобы улучшить возможности LLMs в IPP.
## Метод
Мы предлагаем метод, названный Cognitive Surgery (CoSur), который включает в себя следующие модули: **representation extraction**, **territory construction**, **authorship discrimination** и **cognitive editing**. Модуль **representation extraction** отвечает за извлечение характеристик текстов, а **territory construction** — за создание специфического пространства, в котором можно отличить тексты, сгенерированные моделью и тексты, сгенерированные другими источниками. Используя **authorship discrimination**, мы проводим авторское определение, а **cognitive editing** позволяет модели самоулучшаться в процессе работы. Наша архитектура поддерживает эффективное повышение точности в IPP-сценарии.
## Результаты
Мы провели эксперименты, используя три разных модели LLM, и сравнили их результаты с использованием нашего метода CoSur. Результаты показали, что наша методика улучшает производительность LLMs в IPP-сценарии, достигнув следующих результатов: модель 1 — 83.25%, модель 2 — 66.19%, модель 3 — 88.01%. Эти результаты показывают, что CoSur повышает точность определения, что делает решение более надежным и эффективным.
## Значимость
Наша работа имеет значительное значение в области применения моделей текстового понимания. Улучшенная возможность определения авторства может пригодиться в различных приложениях, таких как детекция поддельности текстов, анализ авторских стилей, автоматизированные системы обработки текстов и другие. CoSur не только улучшает выполнение конкретной задачи но и демонстрирует потенциал для дальнейшего исследования творческого поведения моделей текстового понимания.
## Выводы
Выводы нашей работы заключаются в следующем: мы успешно показали, что Implicit Territorial Awareness может быть "пробуждена" в LLMs с помощью CoSur. Это не только улучшает производительность моделей в IPP, но и открывает пути для дальнейшего исследования возможностей LLMs в задачах текстового понимания. Мы планируем продолжить работу над улучшением нашей методики и её при
Abstract
Large language models (LLMs) have been shown to possess a degree of
self-recognition capability-the ability to identify whether a given text was
generated by themselves. Prior work has demonstrated that this capability is
reliably expressed under the Pair Presentation Paradigm (PPP), where the model
is presented with two texts and asked to choose which one it authored. However,
performance deteriorates sharply under the Individual Presentation Paradigm
(IPP), where the model is given a single text to judge authorship. Although
this phenomenon has been observed, its underlying causes have not been
systematically analyzed. In this paper, we first replicate existing findings to
confirm that LLMs struggle to distinguish self- from other-generated text under
IPP. We then investigate the reasons for this failure and attribute it to a
phenomenon we term Implicit Territorial Awareness (ITA)-the model's latent
ability to distinguish self- and other-texts in representational space, which
remains unexpressed in its output behavior. To awaken the ITA of LLMs, we
propose Cognitive Surgery (CoSur), a novel framework comprising four main
modules: representation extraction, territory construction, authorship
discrimination and cognitive editing. Experimental results demonstrate that our
proposed method improves the performance of three different LLMs in the IPP
scenario, achieving average accuracies of 83.25%, 66.19%, and 88.01%,
respectively.
Ссылки и действия
Дополнительные ресурсы: