Gaussian Primitive Optimized Deformable Retinal Image Registration
2508.16852v1
cs.CV, cs.AI, eess.IV
2025-08-27
Авторы:
Xin Tian, Jiazheng Wang, Yuxi Zhang, Xiang Chen, Renjiu Hu, Gaolei Li, Min Liu, Hang Zhang
Резюме на русском
## Контекст
Поиск эффективных методов регистрации деформируемых сетчатки глаза является ключевым вопросом в оптической координации и медицинской информатике. Несмотря на развитие методов машинного обучения, регистрация деформированных сетчаток глаза остается сложной задачей из-за простых зон и сильно выраженных искажений. Недостаток градиентных сигналов в стандартных решениях часто приводит к ошибкам в регистрации. Эта проблема вносит значительные затруднения в клинических применениях, таких как микроскопическая операция в опточной координации. Данная работа адресует эти сложности, предлагая новый подход для регистрации деформируемых сетчаток глаза.
## Метод
Предложенный подход, Gaussian Primitive Optimization (GPO), опирается на многослойную архитектуру с использованием ключевых точек, распределенных по сетчатке глаза. Ключевые точки определяются на базе самых выраженных анатомических структур, таких как крупные сети сосудов. Для каждой ключевой точки используется гибкая модель, описываемая Гауссовыми примитивами, которая позволяет адаптироваться к локальным изометрическим изображениям. Затем, используя K-ближайших соседей (KNN), распространяются градиентные сигналы от ключевых точек к соседним регионам, обеспечивая глобальную консистентность деформационного поля. Метод оптимизируется с помощью многоугольной функции потерь, которая использует согласование ключевых точек и интенсивности изображений.
## Результаты
Эксперименты проводились на датасете FIRE, где сравнивались результаты GPO с другими современными методами регистрации. Результаты показывают, что GPO существенно улучшает точность регистрации: точность повышается до ~2.4 пикселей по отношению к исходному решению, который давал ошибки ~6.2 пикселей. Кроме того, повышение AUC (Area Under Curve) достигло значительных показателей, 0.938 по сравнению с 0.770 у существующих решений. Эти результаты подтверждают эффективность GPO в решении проблем с ранее выявленными ограничениями.
## Значимость
Разработанный подход имеет широкие перспективы в медицинских применениях. Он может применяться в оптической координации для улучшения точности визуального мониторинга в реальном времени. Благодаря своей гибкости и удачному подходу к решению проблемы недостатка градиентных сигналов, GPO может стать ключевым инструментом для решения задач регистрации даже в условиях высокой деформации и простых регионов.
## Выводы
Результаты показывают, что GPO является эффективным инструментом для решения проблем регистрации деформируемых сетчаток глаза. В будущем планируется ра
Abstract
Deformable retinal image registration is notoriously difficult due to large
homogeneous regions and sparse but critical vascular features, which cause
limited gradient signals in standard learning-based frameworks. In this paper,
we introduce Gaussian Primitive Optimization (GPO), a novel iterative framework
that performs structured message passing to overcome these challenges. After an
initial coarse alignment, we extract keypoints at salient anatomical structures
(e.g., major vessels) to serve as a minimal set of descriptor-based control
nodes (DCN). Each node is modelled as a Gaussian primitive with trainable
position, displacement, and radius, thus adapting its spatial influence to
local deformation scales. A K-Nearest Neighbors (KNN) Gaussian interpolation
then blends and propagates displacement signals from these information-rich
nodes to construct a globally coherent displacement field; focusing
interpolation on the top (K) neighbors reduces computational overhead while
preserving local detail. By strategically anchoring nodes in high-gradient
regions, GPO ensures robust gradient flow, mitigating vanishing gradient signal
in textureless areas. The framework is optimized end-to-end via a multi-term
loss that enforces both keypoint consistency and intensity alignment.
Experiments on the FIRE dataset show that GPO reduces the target registration
error from 6.2\,px to ~2.4\,px and increases the AUC at 25\,px from 0.770 to
0.938, substantially outperforming existing methods. The source code can be
accessed via https://github.com/xintian-99/GPOreg.
Ссылки и действия
Дополнительные ресурсы: