Discovering equations from data: symbolic regression in dynamical systems

2508.20257v1 cs.LG, stat.ML 2025-08-29
Авторы:

Beatriz R. Brum, Luiza Lober, Isolde Previdelli, Francisco A. Rodrigues

Резюме на русском

## Контекст Область исследования, связанная с открытием уравнений из данных, лежит в основе физики и многих других научных областей, таких как математическая экология и эпидемиология. Этот процесс является ключевым для понимания и моделирования сложных динамических систем. Однако традиционные методы часто ограничиваются ручным поиском или ограниченными формами уравнений. В этой статье рассматривается автоматический подход, основанный на методах символьной регрессии, который автоматизирует поиск уравнений, описывающих данные. Несмотря на то, что существуют различные методы символьной регрессии, их сравнение, особенно в контексте динамических систем, является важной задачей. Целью данной работы является оценка и сравнение пяти методов символьной регрессии в отношении их точности и возможности восстановить уравнения из динамических процессов. ## Метод Для сравнения методов символьной регрессии использовались пять различных алгоритмов, включая PySR, Eureqa, PySRR, и другие. Для оценки их потенциала восстановления уравнений из динамических процессов, были использованы данные от девяти различных систем, включая сингулярные точки, хаотические динамики и модели эпидемий. Алгоритмы применялись к данным, генерируемым этими системами, с целью восстановить аналитические уравнения, описывающие их поведение. Использовались различные метрики для оценки точности, включая погрешность, вычислительные затраты и удобочитаемость полученных уравнений. Наиболее эффективным оказался алгоритм PySR, который показал выдающийся результат по всем метрикам. ## Результаты Результаты экспериментов показали, что PySR превосходит другие методы по всем показателям. Алгоритм оказался высокоточным в восстановлении уравнений, с очень маленькой погрешностью в сравнении с аналитическими формами. Были достигнуты замечательные результаты восстановления уравнений, в том числе для систем с хаотическим поведением и сложными моделями эпидемий. Была также отмечена высокая скорость вычислений и удобочитаемость полученных уравнений. Эти результаты демонстрируют высокую эффективность PySR в выявлении сложных динамических зависимостей в данных. ## Значимость Полученные результаты имеют большое значение для областей, где автоматическое выявление уравнений играет ключевую роль, таких как физика, биология, и другие науки. Алгоритм PySR может быть применен для моделирования сложных динамических систем в экологии, эпидемиологии и других дисциплинах. Особый потенциал PySR заключается в том, что он может быть использован для восстановления уравнений в реа

Abstract

The process of discovering equations from data lies at the heart of physics and in many other areas of research, including mathematical ecology and epidemiology. Recently, machine learning methods known as symbolic regression have automated this process. As several methods are available in the literature, it is important to compare them, particularly for dynamic systems that describe complex phenomena. In this paper, five symbolic regression methods were used for recovering equations from nine dynamical processes, including chaotic dynamics and epidemic models, with the PySR method proving to be the most suitable for inferring equations. Benchmark results demonstrate its high predictive power and accuracy, with some estimates being indistinguishable from the original analytical forms. These results highlight the potential of symbolic regression as a robust tool for inferring and modelling real-world phenomena.

Ссылки и действия