Discovering equations from data: symbolic regression in dynamical systems
2508.20257v1
cs.LG, stat.ML
2025-08-29
Авторы:
Beatriz R. Brum, Luiza Lober, Isolde Previdelli, Francisco A. Rodrigues
Резюме на русском
## Контекст
Область исследования, связанная с открытием уравнений из данных, лежит в основе физики и многих других научных областей, таких как математическая экология и эпидемиология. Этот процесс является ключевым для понимания и моделирования сложных динамических систем. Однако традиционные методы часто ограничиваются ручным поиском или ограниченными формами уравнений. В этой статье рассматривается автоматический подход, основанный на методах символьной регрессии, который автоматизирует поиск уравнений, описывающих данные. Несмотря на то, что существуют различные методы символьной регрессии, их сравнение, особенно в контексте динамических систем, является важной задачей. Целью данной работы является оценка и сравнение пяти методов символьной регрессии в отношении их точности и возможности восстановить уравнения из динамических процессов.
## Метод
Для сравнения методов символьной регрессии использовались пять различных алгоритмов, включая PySR, Eureqa, PySRR, и другие. Для оценки их потенциала восстановления уравнений из динамических процессов, были использованы данные от девяти различных систем, включая сингулярные точки, хаотические динамики и модели эпидемий. Алгоритмы применялись к данным, генерируемым этими системами, с целью восстановить аналитические уравнения, описывающие их поведение. Использовались различные метрики для оценки точности, включая погрешность, вычислительные затраты и удобочитаемость полученных уравнений. Наиболее эффективным оказался алгоритм PySR, который показал выдающийся результат по всем метрикам.
## Результаты
Результаты экспериментов показали, что PySR превосходит другие методы по всем показателям. Алгоритм оказался высокоточным в восстановлении уравнений, с очень маленькой погрешностью в сравнении с аналитическими формами. Были достигнуты замечательные результаты восстановления уравнений, в том числе для систем с хаотическим поведением и сложными моделями эпидемий. Была также отмечена высокая скорость вычислений и удобочитаемость полученных уравнений. Эти результаты демонстрируют высокую эффективность PySR в выявлении сложных динамических зависимостей в данных.
## Значимость
Полученные результаты имеют большое значение для областей, где автоматическое выявление уравнений играет ключевую роль, таких как физика, биология, и другие науки. Алгоритм PySR может быть применен для моделирования сложных динамических систем в экологии, эпидемиологии и других дисциплинах. Особый потенциал PySR заключается в том, что он может быть использован для восстановления уравнений в реа
Abstract
The process of discovering equations from data lies at the heart of physics
and in many other areas of research, including mathematical ecology and
epidemiology. Recently, machine learning methods known as symbolic regression
have automated this process. As several methods are available in the
literature, it is important to compare them, particularly for dynamic systems
that describe complex phenomena. In this paper, five symbolic regression
methods were used for recovering equations from nine dynamical processes,
including chaotic dynamics and epidemic models, with the PySR method proving to
be the most suitable for inferring equations. Benchmark results demonstrate its
high predictive power and accuracy, with some estimates being indistinguishable
from the original analytical forms. These results highlight the potential of
symbolic regression as a robust tool for inferring and modelling real-world
phenomena.
Ссылки и действия
Дополнительные ресурсы: