Can Large Language Models Adequately Perform Symbolic Reasoning Over Time Series?

2508.03963v1 cs.AI 2025-08-09
Авторы:

Zewen Liu, Juntong Ni, Xianfeng Tang, Max S. Y. Lau, Wei Jin

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Раскрытие скрытых символических законов из временных рядов — задача, которая волнует ученых с момента открытия Кеплером законов планетарного движения. Данная проблема представляет собой одну из ключевых вызовов в научном открытии и развитии искусственного интеллекта. Временные ряды — это последовательности данных, зависящие от времени, которые характеризуются сложной структурой и подразумевают необходимость выявления скрытых закономерностей и зависимостей. Однако, несмотря на то, что в последние годы было достигнуто значительное прогресса в области машинного обучения и искусственного интеллекта, существуют значительные трудности в том, чтобы систематически и точно выявить символические законы из таких данных. Традиционные методы, такие как символическая регрессия, часто ограничены простой алгебраической формой уравнений, не позволяющей охватить более сложные и нелинейные структуры. Более того, многие существующие подходы не могут эффективно интегрировать контекстуальную информацию и доменное знание, что существенно ограничивает их применимость в реальных приложениях. Например, в области медицины, финансов или климатических исследований, где временные ряды характеризуются высокой динамичностью и сложностью, необходимо создание моделей, которые могут не только предсказывать, но и объяснять причинно-следственные отношения. В этой связи, Large Language Models (LLMs), которые показали высокую эффективность в задачах структурированного разумения, могут быть полезны для решения этой проблемы. Однако, их способность выводить интерпретируемые, контекстно-ориентированные символические структуры из временных рядов до сих пор недостаточно изучена. Это побудило исследователей к созданию комплексного бенчмарка, SymbolBench, который позволяет оценивать способность LLMs к символическому разумению в задачах, связанных с временными рядами. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения поставленной задачи, авторы предлагают интегрировать Large Language Models с генетическим программированием в рамках единой рамки, которая называется SymbolBench. Эта рамка состоит из трех основных задач: многомерная символическая регрессия, вывод булевых сетей и открытие причинно-следственных отношений. Эти задачи охватывают разнообразные символические формы с различным уровнем сложности, что позволяет оценить способность моделей к разнообразным видам символического разумения. SymbolBench предлагает комплексный подход, где LLMs выступают в роли предсказателей и оценщиков. Генетическое программирование используется для генерации предполагаемых символических законов, которые затем оцениваются LLMs на соответствие данным и контексту. Это замыкаемая петля, где LLMs не только выводят законы, но и проверяют их на соответствие реальным данным. Такой подход позволяет сочетать доменное знание, контекстуальную информацию и структуру разумения, что является ключевым фактором для улучшения производительности LLMs в автоматизированном научном открытии. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ В рамках экспериментов были использованы различные наборы данных, представляющие временные ряды из различных областей, таких как физика, медицина и финансы. SymbolBench позволил оценить производительность различных моделей на каждой из трех задач. Результаты показали, что LLMs могут достичь высоких результатов в некоторых случаях, особенно когда задача состоит в выводе простых символических законов. Однако, при увеличении сложности задач, таких как вывод булевых сетей или открытие причинно-следственных отношений, производительность LLMs снижается. Одной из ключевых проблем, выявленных в экспериментах, является необходимость в дополнительном контексте и доменном знании для улучшения точности вывода. Без этого, LLMs могут выдавать результаты, которые не соответствуют реальным закономерностям. Тем не менее, комбинация LLMs с генетическим программированием показала потенциал улучшения результатов, особенно в тех случаях, когда необходимо обрабатывать более сложные символические формы. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод имеет широкий спектр практических применений. Например, в области медицины, он может быть использован для выявления причинно-следственных отношений в данных о пациентах, что может помочь в диагностике и лечении заболеваний. В финансовой сфере, этот подход может быть применен для анализа временных рядов рыночных данных, что позволит выявить скрытые закономерности и сделать более точные прогнозы. Кроме того, данный подход может быть использован в области климатических исследований для выявления законов, характеризующих изменения климата. Это может помочь ученым лучше понять динамику климатических процессов и разработать более эффективные стратегии для борьбы с ними. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В целом, эта работа показывает, что Large Language Models имеют потенциал для решения сложных задач символического разумения в области временных рядов. Однако, для достижения более высоких результатов необходимо сочетание доменного знания, контекстуальной информации и структурированного подхода к выводу. Будущие исследования могут фокусироваться на улучшении этих аспектов, что позволит создать более эффективные методы для автоматического научного открытия.

Abstract

Uncovering hidden symbolic laws from time series data, as an aspiration dating back to Kepler's discovery of planetary motion, remains a core challenge in scientific discovery and artificial intelligence. While Large Language Models show promise in structured reasoning tasks, their ability to infer interpretable, context-aligned symbolic structures from time series data is still underexplored. To systematically evaluate this capability, we introduce SymbolBench, a comprehensive benchmark designed to assess symbolic reasoning over real-world time series across three tasks: multivariate symbolic regression, Boolean network inference, and causal discovery. Unlike prior efforts limited to simple algebraic equations, SymbolBench spans a diverse set of symbolic forms with varying complexity. We further propose a unified framework that integrates LLMs with genetic programming to form a closed-loop symbolic reasoning system, where LLMs act both as predictors and evaluators. Our empirical results reveal key strengths and limitations of current models, highlighting the importance of combining domain knowledge, context alignment, and reasoning structure to improve LLMs in automated scientific discovery.

Ссылки и действия