FMD-TransUNet: Abdominal Multi-Organ Segmentation Based on Frequency Domain Multi-Axis Representation Learning and Dual Attention Mechanisms
2509.16044v1
eess.IV, cs.CV
2025-09-23
Авторы:
Fang Lu, Jingyu Xu, Qinxiu Sun, Qiong Lou
Резюме на русском
## Контекст
Абдоминальная многоорганная сегментация является критическим аспектом в медицинских приложениях, таких как планирование операций и диагностика. Несмотря на развитие глубоких нейронных сетей, сегментация небольших, необычных или анатомически сложных органов до сих пор остается вызовом. Большинство нынешних методов ориентированы на спатिальный анализ, недостаточно используя потенциал анализа в частотном домене. Наша мотивация заключается в разработке метода, который бы оптимизировал сегментацию многоорганных структур с учетом частотных особенностей.
## Метод
Мы предлагаем FMD-TransUNet, который сочетает технологию Multi-Axis External Weight Block (MEWB) и усовершенствованный модуль Dual Attention (DA+). MEWB извлекает фичи частотного домена по нескольким осям, позволяя подчеркнуть как глобальные структуры, так и локальные детали. DA+ использует депсуальные плотные свертки и объединяет механизмы спатсального и канального внимания, чтобы улучшить фузирование признаков и уменьшить графовый разрыв. Такой подход обеспечивает более точную сегментацию.
## Результаты
Мы проводили эксперименты на Synapse-данных, сравнивая FMD-TransUNet с другими новейшими методами. Метрики: DSC 81.32%, HD 16.35 мм. Наш метод показал улучшение на 3.84% в DSC и 15.34 мм в HD по сравнению с базовым TransUNet. Эти результаты демонстрируют эффективность FMD-TransUNet в улучшении точности сегментации многоорганной анатомии.
## Значимость
Наша разработка может применяться в клинических задачах, таких как хирургическое планирование и робототехническая системы. Она обеспечивает более точную сегментацию, снижает вероятность ошибок и повышает эффективность в медицинских работах. Это может положительно сказаться на качестве лечения и улучшении результатов.
## Выводы
Мы разработали FMD-TransUNet, который значительно улучшает точность сегментации многоорганной анатомии. Будущие исследования будут отводиться на расширение применений и улучшение методики для других медицинских задач.
Abstract
Accurate abdominal multi-organ segmentation is critical for clinical
applications. Although numerous deep learning-based automatic segmentation
methods have been developed, they still struggle to segment small, irregular,
or anatomically complex organs. Moreover, most current methods focus on
spatial-domain analysis, often overlooking the synergistic potential of
frequency-domain representations. To address these limitations, we propose a
novel framework named FMD-TransUNet for precise abdominal multi-organ
segmentation. It innovatively integrates the Multi-axis External Weight Block
(MEWB) and the improved dual attention module (DA+) into the TransUNet
framework. The MEWB extracts multi-axis frequency-domain features to capture
both global anatomical structures and local boundary details, providing
complementary information to spatial-domain representations. The DA+ block
utilizes depthwise separable convolutions and incorporates spatial and channel
attention mechanisms to enhance feature fusion, reduce redundant information,
and narrow the semantic gap between the encoder and decoder. Experimental
validation on the Synapse dataset shows that FMD-TransUNet outperforms other
recent state-of-the-art methods, achieving an average DSC of 81.32\% and a HD
of 16.35 mm across eight abdominal organs. Compared to the baseline model, the
average DSC increased by 3.84\%, and the average HD decreased by 15.34 mm.
These results demonstrate the effectiveness of FMD-TransUNet in improving the
accuracy of abdominal multi-organ segmentation.
Ссылки и действия
Дополнительные ресурсы: