## Контекст
Angle-resolved photoemission spectroscopy (ARPES) является важной технологией для изучения поверхностных и энергетических структур в материалах. Она позволяет проанализировать энергетическое распределение электронов на поверхности и динамику их интеракции с зоной Ферми. Несмотря на развитие технологий, ARPES сталкивается с проблемами в обработке и анализе многомерных данных, возникающих при использовании современных сенсоров и систем измерения. Машинное обучение (ML) используется для упрощения этих задач, однако недостаток высококачественных данных для обучения ограничивает его эффективность. Целью настоящей работы является разработка симуляционного фреймворка для генерации данных ARPES, который может значительно упростить исследовательский процесс.
## Метод
Разработанный фреймворк, названный Aurelia, является открытым исходным кодом и специализируется на симуляции сигналов ARPES. Он использует геометрические модели, физические модели переходов электронов и методы симуляции отклика материала на ангулярно-резолюционное действие фотоэмиссии. Фреймворк генерирует синтетические данные ARPES, которые могут быть использованы для обучения моделей ML, включая глубокие нейронные сети. Для демонстрации возможностей Aurelia, мы обучили конволюционную нейронную сеть (CNN) для оценки качества спектров ARPES, важной задачей в эксперименте.
## Результаты
Используя Aurelia, мы генерировали большие наборы синтетических данных ARPES, которые были использованы для обучения CNN. Модель была специально настроена для оценки качества спектров ARPES в начальной стадии эксперимента, которая требует точной настройки и анализа. Наши результаты показали, что CNN, обученная на синтетических данных, превосходит людской анализ в точности определения качества спектров и быстрости выявления оптимальных областей измерений. Это доказывает, что симуляционные данные ARPES могут эффективно заменить экспериментальные данные в ходе обучения ML-моделей.
## Значимость
Разработанный подход имеет широкое применение в области ARPES, в том числе для автоматизации анализа данных, улучшения точности измерений и сокращения времени экспериментов. Он также может быть использован в других областях, где требуется синтез высококачественных данных для обучения ML-моделей. Преимуществами работы является уменьшение затрат на сбор экспериментальных данных, увеличение точности исследований и возможность исследователям сосредоточиться на анализе результатов вместо рутинных задач.
## Выводы
Работа доказывает, что симуляционные данные ARPES могут значительно улучшить эффективность и точность исследований в области глубокого обучения. Будущие исс