A Graph Neural Network Approach for Mapping the Conceptual Structure and Inter-Branch Connectivity of Physics
2508.05724v1
cs.LG, physics.data-an, 68T07, 81-08, 05C90, I.2.6; G.2.2; I.5.1
2025-08-12
Авторы:
Massimiliano Romiti
Резюме на русском
## Контекст
Физика, как широкая и сложная область науки, часто требует объединения различных подходов для понимания и анализа физических законов и принципов. Одной из проблем является необходимость структурирования и анализа пространства физических законов, чтобы обнаружить связи, аналогии и центральные взаимосвязи между различными физическими подсистемами. Существуют методы, такие как классические графы и графовые модели, однако они часто имеют ограниченную способность адаптироваться к сложным структурам и недостаточно эффективно отображают взаимосвязи в физике. Это привело к поиску новых, более точных и гибких подходов к рассмотрению физических законов.
## Метод
Для решения этой проблемы был разработан новый фреймворк, основанный на графе, который представляет физические законы в виде значимости весовых связей между физическими уравнениями. База данных была создана на основе 659 уравнений, которые были подвергнуты тщательной очистке семантических данных для устранения несоответствий и неоднозначностей. В результате было получено 400 уравнений, которые были представлены в виде графа, где каждое уравнение является узлом, а связи между уравнениями определяются весами, определяемыми метриками, такими как пересечение переменных, библиографические данные и физически обоснованные оценки. Для обучения и анализа использовался граф-сеть с вниманием (Graph Attention Network, GAT), который был обучен для прогнозирования связей между уравнениями.
## Результаты
После обучения модели был выполнен ряд экспериментов, включая сравнение с другими методами, такими как GraphSAGE и классические графовые алгоритмы. Модель GAT показала самые высокие результаты на тестовых данных, достигнув AUC 0.9742 ± 0.0018, что значительно выше результатов других методов (например, GraphSAGE достиг AUC 0.9504, p = 0.029). Эксперименты также показали, что модель способна естественно восстановить известные структуры физики, такие как связь между электромагнетизмом и статистической механикой. Более того, модель обнаружила центральные узлы, которые являются ключевыми связями между различными физическими областями, и сгенерировала множество новых гипотез о взаимосвязях между различными физическими подсистемами.
## Значимость
Разработанная модель имеет большое значение в области представления и анализа физических законов. Она может быть применена в различных областях, таких как образование, исследования, научная коммуникация и разработка новых теорий. Наиболее применима для определения взаимосвязей ме
Abstract
This work introduces a novel framework for representing and analyzing
physical laws as a weighted knowledge graph. We constructed a database of 659
distinct physical equations, subjected to rigorous semantic cleaning to resolve
notational ambiguities, resulting in a corpus of 400 advanced physics
equations. We developed an enhanced graph representation where both physical
concepts and equations are nodes, connected by weighted inter-equation bridges.
These weights are objectively defined using normalized metrics for variable
overlap, physics-informed importance scores, and bibliometric data. A Graph
Attention Network (GAT) was trained for link prediction, achieving a test AUC
of 0.9742 +/- 0.0018 across five independent runs, significantly outperforming
both classical heuristics (best baseline AUC: 0.9487) and established GNN
architectures like GraphSAGE (AUC: 0.9504, p = 0.029). Statistical testing
confirmed significance of all comparisons (p < 0.05), with 2.7% improvement
over the best baseline. Our analysis reveals three key findings: (i) The model
autonomously rediscovers the known macroscopic structure of physics,
identifying strong conceptual axes between Electromagnetism and Statistical
Mechanics. (ii) It identifies central hub equations that serve as critical
bridges between multiple physical domains. (iii) The model generates stable,
computationally-derived hypotheses for cross-domain relationships, identifying
both known principles and suggesting novel mathematical analogies for further
theoretical investigation. The framework can generate hundreds of such
hypotheses, enabling the creation of specialized datasets for targeted analysis
of specific physics subfields. Code and data available at
https://github.com/kingelanci/graphysics