Intraoperative 2D/3D Registration via Spherical Similarity Learning and Inference-Time Differentiable Levenberg-Marquardt Optimization
2509.06890v1
cs.CV, eess.IV
2025-09-10
Авторы:
Minheng Chen, Youyong Kong
Резюме на русском
## Контекст
Компьютерная томография (CT) и радиография широко используются в медицинских процедурах для трансформации реальных 2D-изображений в 3D-реконструкции. Однако требуется точное взаимодействие между реальными 2D-изображениями и существующими 3D-предобработками, чтобы обеспечить точное координирование инструментов и имплантатов во время операций. Для этого требуется эффективная методика интраоперативной регистрации 2D/3D. Известные методы страдают от неточности и тормоза в ходе инференции, что может привести к ошибкам в задаче выравнивания. Было предложено использовать геодестные расстояния в многообразии SE(3), но существующие подходы недостаточно эффективны для учета сложной топологии многообразия. Мы рассматриваем новый подход, основанный на неевклидовой метрике в шаровом пространстве, что позволит улучшить точность и скорость регистрации.
## Метод
Мы предлагаем новую модель, основанную на неевклидовой метрике в шаровом пространстве для решения задачи интраоперативной регистрации 2D/3D. Наша модель включает в себя CNN-Transformer encoder, который извлекает функциональные признаки из входных данных. Эти признаки проецируются в шаровое пространство с использованием Riemannian distances в bi-invariant SO(4) пространстве. Это позволяет улучшить точность и скорость регистрации, так как более лояльно учитывается сложность многообразия. Мы также используем Levenberg-Marquardt optimization в качестве оптимизатора во время инференции, чтобы расширить возможности градиентного спуска и ускорить решение задачи.
## Результаты
Мы провели эксперименты на реальных и синтетических данных для оценки эффективности нашего подхода. Наши результаты показывают, что наша модель превосходит существующие методы по точности и скорости регистрации. Также мы приводим сравнение с другими подходами, показывающим, что наша модель дает более точные результаты в случаях, когда есть значительные нарушения выравнивания. Эти результаты подтверждают эффективность нашего подхода в обеспечении точного и быстрого выравнивания 2D и 3D данных во время операций.
## Значимость
Наш подход может быть применен в многих областях, где требуется высокая точность и скорость регистрации в интраоперативных условиях. Одним из основных преимуществ является улучшенная точность и скорость регистрации, что может существенно повысить качество медицинских процедур. Кроме того, наш метод может быть применен в технических задачах, требующих точного анализа и выравнивания данных, например, в системах навигации и автоматизированных системах контроля. Мы также видим потенциал нашего под
Abstract
Intraoperative 2D/3D registration aligns preoperative 3D volumes with
real-time 2D radiographs, enabling accurate localization of instruments and
implants. A recent fully differentiable similarity learning framework
approximates geodesic distances on SE(3), expanding the capture range of
registration and mitigating the effects of substantial disturbances, but
existing Euclidean approximations distort manifold structure and slow
convergence. To address these limitations, we explore similarity learning in
non-Euclidean spherical feature spaces to better capture and fit complex
manifold structure. We extract feature embeddings using a CNN-Transformer
encoder, project them into spherical space, and approximate their geodesic
distances with Riemannian distances in the bi-invariant SO(4) space. This
enables a more expressive and geometrically consistent deep similarity metric,
enhancing the ability to distinguish subtle pose differences. During inference,
we replace gradient descent with fully differentiable Levenberg-Marquardt
optimization to accelerate convergence. Experiments on real and synthetic
datasets show superior accuracy in both patient-specific and patient-agnostic
scenarios.
Ссылки и действия
Дополнительные ресурсы: