Probing Syntax in Large Language Models: Successes and Remaining Challenges

2508.03211v1 cs.CL 2025-08-09
Авторы:

Pablo J. Diego-Simón, Emmanuel Chemla, Jean-Rémi King, Yair Lakretz

Резюме на русском

**Резюме** В статье Probing Syntax in Large Language Models: Successes and Remaining Challenges рассматривается проблема определения синтаксических структур в текстах с помощью структурных проб (structural probes), применяемых к большим языковым моделям (LLMs). Несмотря на то, что эти модели эффективно выделяют синтаксические структуры, существуют неясности влияния статистических и грамматических факторов на эти процессы. Авторы провели анализ на трех контролируемых бенчмарках и выявили три основных вывода. Во-первых, структурные пробы часто синхронизируются с геометрическими свойствами текста — точнее два слова находятся в предложении, тем выше вероятность, что проба считает их синтаксически связанными. Во-вторых, структурные пробы сталкиваются с глубинными синтаксическими структурами и могут быть отвлечены некорректными формами слов или межсловными взаимодействиями. В-третьих, непредсказуемость отдельных слов не влияет на работу проб. В итоге, статья определяет главные проблемы структурных проб и предлагает контролируемую среду для их более точного оценивания.

Abstract

The syntactic structures of sentences can be readily read-out from the activations of large language models (LLMs). However, the ``structural probes'' that have been developed to reveal this phenomenon are typically evaluated on an indiscriminate set of sentences. Consequently, it remains unclear whether structural and/or statistical factors systematically affect these syntactic representations. To address this issue, we conduct an in-depth analysis of structural probes on three controlled benchmarks. Our results are three-fold. First, structural probes are biased by a superficial property: the closer two words are in a sentence, the more likely structural probes will consider them as syntactically linked. Second, structural probes are challenged by linguistic properties: they poorly represent deep syntactic structures, and get interfered by interacting nouns or ungrammatical verb forms. Third, structural probes do not appear to be affected by the predictability of individual words. Overall, this work sheds light on the current challenges faced by structural probes. Providing a benchmark made of controlled stimuli to better evaluate their performance.

Ссылки и действия