Intraoperative 2D/3D Registration via Spherical Similarity Learning and Inference-Time Differentiable Levenberg-Marquardt Optimization

2509.06890v1 cs.CV, eess.IV 2025-09-10
Авторы:

Minheng Chen, Youyong Kong

Резюме на русском

## Контекст Компьютерная томография (CT) и радиография широко используются в медицинских процедурах для трансформации реальных 2D-изображений в 3D-реконструкции. Однако требуется точное взаимодействие между реальными 2D-изображениями и существующими 3D-предобработками, чтобы обеспечить точное координирование инструментов и имплантатов во время операций. Для этого требуется эффективная методика интраоперативной регистрации 2D/3D. Известные методы страдают от неточности и тормоза в ходе инференции, что может привести к ошибкам в задаче выравнивания. Было предложено использовать геодестные расстояния в многообразии SE(3), но существующие подходы недостаточно эффективны для учета сложной топологии многообразия. Мы рассматриваем новый подход, основанный на неевклидовой метрике в шаровом пространстве, что позволит улучшить точность и скорость регистрации. ## Метод Мы предлагаем новую модель, основанную на неевклидовой метрике в шаровом пространстве для решения задачи интраоперативной регистрации 2D/3D. Наша модель включает в себя CNN-Transformer encoder, который извлекает функциональные признаки из входных данных. Эти признаки проецируются в шаровое пространство с использованием Riemannian distances в bi-invariant SO(4) пространстве. Это позволяет улучшить точность и скорость регистрации, так как более лояльно учитывается сложность многообразия. Мы также используем Levenberg-Marquardt optimization в качестве оптимизатора во время инференции, чтобы расширить возможности градиентного спуска и ускорить решение задачи. ## Результаты Мы провели эксперименты на реальных и синтетических данных для оценки эффективности нашего подхода. Наши результаты показывают, что наша модель превосходит существующие методы по точности и скорости регистрации. Также мы приводим сравнение с другими подходами, показывающим, что наша модель дает более точные результаты в случаях, когда есть значительные нарушения выравнивания. Эти результаты подтверждают эффективность нашего подхода в обеспечении точного и быстрого выравнивания 2D и 3D данных во время операций. ## Значимость Наш подход может быть применен в многих областях, где требуется высокая точность и скорость регистрации в интраоперативных условиях. Одним из основных преимуществ является улучшенная точность и скорость регистрации, что может существенно повысить качество медицинских процедур. Кроме того, наш метод может быть применен в технических задачах, требующих точного анализа и выравнивания данных, например, в системах навигации и автоматизированных системах контроля. Мы также видим потенциал нашего под

Abstract

Intraoperative 2D/3D registration aligns preoperative 3D volumes with real-time 2D radiographs, enabling accurate localization of instruments and implants. A recent fully differentiable similarity learning framework approximates geodesic distances on SE(3), expanding the capture range of registration and mitigating the effects of substantial disturbances, but existing Euclidean approximations distort manifold structure and slow convergence. To address these limitations, we explore similarity learning in non-Euclidean spherical feature spaces to better capture and fit complex manifold structure. We extract feature embeddings using a CNN-Transformer encoder, project them into spherical space, and approximate their geodesic distances with Riemannian distances in the bi-invariant SO(4) space. This enables a more expressive and geometrically consistent deep similarity metric, enhancing the ability to distinguish subtle pose differences. During inference, we replace gradient descent with fully differentiable Levenberg-Marquardt optimization to accelerate convergence. Experiments on real and synthetic datasets show superior accuracy in both patient-specific and patient-agnostic scenarios.

Ссылки и действия