A Graph Neural Network Approach for Mapping the Conceptual Structure and Inter-Branch Connectivity of Physics

2508.05724v1 cs.LG, physics.data-an, 68T07, 81-08, 05C90, I.2.6; G.2.2; I.5.1 2025-08-12
Авторы:

Massimiliano Romiti

Резюме на русском

## Контекст Физика, как широкая и сложная область науки, часто требует объединения различных подходов для понимания и анализа физических законов и принципов. Одной из проблем является необходимость структурирования и анализа пространства физических законов, чтобы обнаружить связи, аналогии и центральные взаимосвязи между различными физическими подсистемами. Существуют методы, такие как классические графы и графовые модели, однако они часто имеют ограниченную способность адаптироваться к сложным структурам и недостаточно эффективно отображают взаимосвязи в физике. Это привело к поиску новых, более точных и гибких подходов к рассмотрению физических законов. ## Метод Для решения этой проблемы был разработан новый фреймворк, основанный на графе, который представляет физические законы в виде значимости весовых связей между физическими уравнениями. База данных была создана на основе 659 уравнений, которые были подвергнуты тщательной очистке семантических данных для устранения несоответствий и неоднозначностей. В результате было получено 400 уравнений, которые были представлены в виде графа, где каждое уравнение является узлом, а связи между уравнениями определяются весами, определяемыми метриками, такими как пересечение переменных, библиографические данные и физически обоснованные оценки. Для обучения и анализа использовался граф-сеть с вниманием (Graph Attention Network, GAT), который был обучен для прогнозирования связей между уравнениями. ## Результаты После обучения модели был выполнен ряд экспериментов, включая сравнение с другими методами, такими как GraphSAGE и классические графовые алгоритмы. Модель GAT показала самые высокие результаты на тестовых данных, достигнув AUC 0.9742 ± 0.0018, что значительно выше результатов других методов (например, GraphSAGE достиг AUC 0.9504, p = 0.029). Эксперименты также показали, что модель способна естественно восстановить известные структуры физики, такие как связь между электромагнетизмом и статистической механикой. Более того, модель обнаружила центральные узлы, которые являются ключевыми связями между различными физическими областями, и сгенерировала множество новых гипотез о взаимосвязях между различными физическими подсистемами. ## Значимость Разработанная модель имеет большое значение в области представления и анализа физических законов. Она может быть применена в различных областях, таких как образование, исследования, научная коммуникация и разработка новых теорий. Наиболее применима для определения взаимосвязей ме

Abstract

This work introduces a novel framework for representing and analyzing physical laws as a weighted knowledge graph. We constructed a database of 659 distinct physical equations, subjected to rigorous semantic cleaning to resolve notational ambiguities, resulting in a corpus of 400 advanced physics equations. We developed an enhanced graph representation where both physical concepts and equations are nodes, connected by weighted inter-equation bridges. These weights are objectively defined using normalized metrics for variable overlap, physics-informed importance scores, and bibliometric data. A Graph Attention Network (GAT) was trained for link prediction, achieving a test AUC of 0.9742 +/- 0.0018 across five independent runs, significantly outperforming both classical heuristics (best baseline AUC: 0.9487) and established GNN architectures like GraphSAGE (AUC: 0.9504, p = 0.029). Statistical testing confirmed significance of all comparisons (p < 0.05), with 2.7% improvement over the best baseline. Our analysis reveals three key findings: (i) The model autonomously rediscovers the known macroscopic structure of physics, identifying strong conceptual axes between Electromagnetism and Statistical Mechanics. (ii) It identifies central hub equations that serve as critical bridges between multiple physical domains. (iii) The model generates stable, computationally-derived hypotheses for cross-domain relationships, identifying both known principles and suggesting novel mathematical analogies for further theoretical investigation. The framework can generate hundreds of such hypotheses, enabling the creation of specialized datasets for targeted analysis of specific physics subfields. Code and data available at https://github.com/kingelanci/graphysics

Ссылки и действия