RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentangled Representation
2509.05554v1
cs.CV, cs.IR
2025-09-10
Авторы:
Yihong Leng, Siming Zheng, Jinwei Chen, Bo Li, Jiaojiao Li, Peng-Tao Jiang
Резюме на русском
## Контекст
Event cameras, такие как Dynamic Vision Sensors (DVS), предлагают возможность получения данных с высокой частотой кадров и низким задержанием, что делает их полезными для задач, таких как движение деблюринга. Однако существуют значительные проблемы, связанные с интерпретацией этих данных. Например, динамические сенсоры DVS используют трейдоff между чувствительностью и шумом, что приводит к повреждению и потере важных деталей в потоке событий. Это ограничивает эффективность существующих методов, которые не полностью учитывают эти ограничения. Мотивация заключается в развитии метода, который бы способствовал более точному и надежному использованию данных event-based, преодолевая эти узкие места.
## Метод
Наша подходящая методика, называемая Robust Event-guided Deblurring (RED), имеет две основные компоненты. Во-первых, мы вводим "Robustness-Oriented Perturbation Strategy" (RPS), которая применяет случайную маскировку к событиям, обучая модель, как справиться с неполными данными. Во-вторых, мы предлагаем модуль OmniAttention, который моделирует интра-модальные, inters-модальные и потоковые корреляции от двух различных, но дополняющих друг друга источников: туманные изображения и частично поврежденные события. Эти модели расширяются на два модуля: один, улучшающий движущиеся области на туманных изображениях, и другой, внедряющий семантический контекст в неполные представления событий.
## Результаты
Мы проводили эксперименты на обе synthetics так и реальных данных, выбрав несколько метрик для оценки точности и надежности результатов. RED показал значительный прогресс по сравнению с современными методами, показывая стабильно высокую точность в различных условиях. Мы также провели обширные анализы, чтобы доказать точность и надежность нашего подхода в случаях с незначительными и существенными изменениями в условиях.
## Значимость
Подход RED имеет потенциал для применения в различных областях, таких как робототехника, детектирование объектов и анализ движения в реальном времени. Он предоставляет более надежную и точную интерпретацию данных event-based, что может улучшить различные приложения, от безопасности до того, как организмы осуществляют движение. Наши выводы указывают на будущие направления исследований, включая расширение модели для работы с более сложными сценариями и выравнивание синхронизации между event-based и RGB-изображениями.
## Выводы
В итоге, RED представляет собой продвинутый подход к движущемуся деблюрингу, который эффективно справляется с трудностями, связанными с данными event-based. Наш метод показал значительные достижения в точности и надежности, демонстрируя расширенную способность интерпретировать и исполь
Abstract
Event cameras provide sparse yet temporally high-temporal-resolution motion
information, demonstrating great potential for motion deblurring. Existing
methods focus on cross-modal interaction, overlooking the inherent
incompleteness of event streams, which arises from the trade-off between
sensitivity and noise introduced by the thresholding mechanism of Dynamic
Vision Sensors (DVS). Such degradation compromises the integrity of motion
priors and limits the effectiveness of event-guided deblurring. To tackle these
challenges, we propose a Robust Event-guided Deblurring (RED) network with
modality-specific disentangled representation. First, we introduce a
Robustness-Oriented Perturbation Strategy (RPS) that applies random masking to
events, which exposes RED to incomplete patterns and then foster robustness
against various unknown scenario conditions.Next, a disentangled OmniAttention
is presented to explicitly model intra-motion, inter-motion, and cross-modality
correlations from two inherently distinct but complementary sources: blurry
images and partially disrupted events. Building on these reliable features, two
interactive modules are designed to enhance motion-sensitive areas in blurry
images and inject semantic context into incomplete event representations.
Extensive experiments on synthetic and real-world datasets demonstrate RED
consistently achieves state-of-the-art performance in both accuracy and
robustness.
Ссылки и действия
Дополнительные ресурсы: