Uncovering Emergent Physics Representations Learned In-Context by Large Language Models
2508.12448v1
cs.CL, cs.LG
2025-08-19
Авторы:
Yeongwoo Song, Jaeyong Bae, Dong-Kyum Kim, Hawoong Jeong
Резюме на русском
## Контекст
Large language models (LLMs) являются мощными инструментами для обработки текстовых задач, основываясь на возможности in-context learning (ICL), которая позволяет им выполнять разнообразные задачи с помощью простых текстовых призывов. Эти модели успешно применяются в многих областях, но понимание механизмов, скрытых за этим процессом, остается неполным. Одним из более захватывающих направлений является исследование того, могут ли LLMs учиться в контексте научных задач, особенно в физике. Физические системы предлагают реальные, данные на основе физических принципов, и их моделирование требует строгого логического мышления. Это делает физические задачи полезными для исследования возможностей LLMs в области устранения неполадок в физических системах. В данном исследовании мы рассматриваем возможность LLMs для того, чтобы "узнавать" физику в контексте и проверяем, насколько эффективно они могут применять эти знания для решения задач.
## Метод
Мы использовали метод in-context learning для оценки возможностей LLMs в физических задачах, опираясь на задачу прогнозирования динамики. Для выявления того, какие части модели активируются в процессе обучения, мы использовали sparse autoencoders (SAEs), которые позволяют определить, какие физические параметры (например, энергия) содержатся в внутренних представлениях модели. Выполнялись повторяемые эксперименты с разными размерами контекста, чтобы проверить, насколько длинные текстовые призывы влияют на точность прогнозов. Эти эксперименты направлены на выявление, как LLMs учится в контексте, и какие физические понятия они могут выучить в процессе обучения.
## Результаты
Наши эксперименты показали, что точность прогноза динамики в физических системах в LLMs улучшается, когда используются более длинные контексты. Мы также выявили, что внутренние представления модели, полученные с помощью SAEs, сильно коррелируют с физическими параметрами, такими как энергия системы. Это указывает на то, что LLMs могут выучивать и хранить значимые физические величины во время обучения в контексте. Мы также заметили, что модель выделяет важные резюме системы, которые позволяют ей делать достаточно точные прогнозы.
## Значимость
Наши результаты показывают, что LLMs могут выучивать физические законы в процессе обучения, что может быть использовано в различных областях, таких как прогнозирование динамики физических систем, моделирование реальных физических процессов или даже в области искусственного интеллекта в сфере робототехники и автоматизации. Это демонстрирует потенциал LLMs для переноса знаний из текста в реальные задачи, что может иметь большой потенциал в област
Abstract
Large language models (LLMs) exhibit impressive in-context learning (ICL)
abilities, enabling them to solve wide range of tasks via textual prompts
alone. As these capabilities advance, the range of applicable domains continues
to expand significantly. However, identifying the precise mechanisms or
internal structures within LLMs that allow successful ICL across diverse,
distinct classes of tasks remains elusive. Physics-based tasks offer a
promising testbed for probing this challenge. Unlike synthetic sequences such
as basic arithmetic or symbolic equations, physical systems provide
experimentally controllable, real-world data based on structured dynamics
grounded in fundamental principles. This makes them particularly suitable for
studying the emergent reasoning behaviors of LLMs in a realistic yet tractable
setting. Here, we mechanistically investigate the ICL ability of LLMs,
especially focusing on their ability to reason about physics. Using a dynamics
forecasting task in physical systems as a proxy, we evaluate whether LLMs can
learn physics in context. We first show that the performance of dynamics
forecasting in context improves with longer input contexts. To uncover how such
capability emerges in LLMs, we analyze the model's residual stream activations
using sparse autoencoders (SAEs). Our experiments reveal that the features
captured by SAEs correlate with key physical variables, such as energy. These
findings demonstrate that meaningful physical concepts are encoded within LLMs
during in-context learning. In sum, our work provides a novel case study that
broadens our understanding of how LLMs learn in context.
Ссылки и действия
Дополнительные ресурсы: