Real-Time Analysis of Unstructured Data with Machine Learning on Heterogeneous Architectures
2508.07423v1
hep-ex, cs.AI, cs.DC, cs.LG, physics.data-an
2025-08-13
Авторы:
Fotis I. Giasemis
Резюме на русском
## Контекст
Область работы связана с проблемами обработки и анализа неструктурированных данных в рамках партикл-физики. Эта область требует высокой точности для проверки текущих моделей субатомного мира. Благодаря планамумуградуации детекторов коллайдирующихся лучей в мировых центрах, таких как Ларже Хадрон Коллайдер (LHC), производство данных выросло в разы. Это приводит к увеличению требований к вычислительным ресурсам. Ученые и инженеры должны оптимизировать процессы фильтрации и реального времени, чтобы обрабатывать большие объемы данных с помощью машинного обучения (ML), а также эффективно использовать архитектуры процессоров, включая графические процессоры (GPU) и поляризованные логические массивы (FPGA).
## Метод
Методология работы основывается на разработке и оптимизации ML-процессов для ускоренных архитектур. Отдельное внимание уделено графовым нейронным сетям (GNN) и их применению в реактивной отслеживаемости частиц в LHCb. Архитектура включает GPU в качестве основного вычислительного ресурса и FPGA в качестве дополнительного ускорителя. Эта конфигурация используется для реализации конечного цепочки анализа данных, ориентированной на реальное время. Его эффективность измеряется по критериям пропускной способности и энергопотребления.
## Результаты
Эксперименты проводились на данных, собираемых в LHC. Модель GNN прошла реактивное отслеживание частиц в реальном времени на GPU, показав высокую точность и скорость. Результаты были сравнены с классическими алгоритмами, используемыми в LHCb. Далее, модель была ускорена на FPGA, показывая точность и энергоэффективность, которые близки к результатам GPU. Результаты подтверждают, что GNN может эффективно использоваться для реактивного отслеживания в первом уровне триггера LHCb.
## Значимость
Результаты демонстрируют перспективу использования ML в партикл-физике, особенно для решения задач в реальном времени. Это может повысить точность и уменьшить энергопотребление, что важно для сложных систем, таких как LHC. Направления для будущих исследований включают улучшение моделей GNN и их интеграцию с новыми архитектурами ускорителей для достижения еще высокой эффективности.
## Выводы
Разработанная GNN-процедура показала высокую эффективность в реактивном отслеживании частиц в реальном времени, когда применяется в LHCb. Это достигнуто благодаря оптимизации методологии и эффективному использованию GPU и FPGA. Будущие исследования будут фокусироваться на улучшении моделей и их интеграции с развивающимися технологиями архите
Abstract
As the particle physics community needs higher and higher precisions in order
to test our current model of the subatomic world, larger and larger datasets
are necessary. With upgrades scheduled for the detectors of colliding-beam
experiments around the world, and specifically at the Large Hadron Collider at
CERN, more collisions and more complex interactions are expected. This directly
implies an increase in data produced and consequently in the computational
resources needed to process them. At CERN, the amount of data produced is
gargantuan. This is why the data have to be heavily filtered and selected in
real time before being permanently stored. This data can then be used to
perform physics analyses, in order to expand our current understanding of the
universe and improve the Standard Model of physics. This real-time filtering,
known as triggering, involves complex processing happening often at frequencies
as high as 40 MHz. This thesis contributes to understanding how machine
learning models can be efficiently deployed in such environments, in order to
maximize throughput and minimize energy consumption. Inevitably, modern
hardware designed for such tasks and contemporary algorithms are needed in
order to meet the challenges posed by the stringent, high-frequency data rates.
In this work, I present our graph neural network-based pipeline, developed for
charged particle track reconstruction at the LHCb experiment at CERN. The
pipeline was implemented end-to-end inside LHCb's first-level trigger, entirely
on GPUs. Its performance was compared against the classical tracking algorithms
currently in production at LHCb. The pipeline was also accelerated on the FPGA
architecture, and its performance in terms of power consumption and processing
speed was compared against the GPU implementation.