📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Farzad Beizaee, Sina Hajimiri, Ismail Ben Ayed, Gregory Lodygensky, Christian Desrosiers, Jose Dolz

**REFLECT (Rectified Flows for Efficient Brain Anomaly Correction Transport): новая модель для эффективного исправления аномалий в биомаркерах** Устранение аномалий в биомаркерах трудностью представляются в силу ограниченности в обучении моделей — полноте медицинских данных. Мы предлагаем модель REFLECT, основанную на rectified flows (регулируемых потоках). Она использует прямой линейный транспортный график для того, чтобы преобразовать аномальные томограмы в нормальные. Это означает, что вместо многошаговых итераций, как в диффузионных моделях, REFLECT достигает результата за один шаг. Эта модель увеличивает точность и скорость процесса. Эксперименты показали, что REFLECT превосходит состояние искусства в аномалии обнаружения. Таким образом, наше рабочее направление дает новый, эффективный подход к локализации и исправлению аномалий в биомаркерах.
Annotation:
Unsupervised anomaly detection (UAD) in brain imaging is crucial for identifying pathologies without the need for labeled data. However, accurately localizing anomalies remains challenging due to the intricate structure of brain anatomy and the scarcity of abnormal examples. In this work, we introduce REFLECT, a novel framework that leverages rectified flows to establish a direct, linear trajectory for correcting abnormal MR images toward a normal distribution. By learning a straight, one-step c...
ID: 2508.02889v1 eess.IV, cs.CV
Авторы:

Puzhen Wu, Mingquan Lin, Qingyu Chen, Emily Y. Chew, Zhiyong Lu, Yifan Peng, Hexin Dong

Это резюме к статье AMD-Mamba: A Phenotype-Aware Multi-Modal Framework for Robust AMD Prognosis. В центре статьи — проблема болезни АМД (age-related macular degeneration), одной из наиболее распространенных причин неизлечимого потери зрения. Авторы предлагают AMD-Mamba, новую многомодальную модель, которая интегрирует цветные фондовые изображения, генетические варианты и социално-демографические данные. Особенностью этой модели является инновационная стратегия метрического обучения, использующая оценку степени серьезности АМД для улучшения понимания патологических изменений. Алгоритм AMD-Mamba способен охватывать как локальные, так и глобальные информационные признаки, такие как изменения сосудистой структуры. Многоразмерная фузия данных и включение клинических переменных в различных разрешениях позволяют модели обеспечивать более точные прогнозы. На AREDS-датасете проведено экспериментальное исследование, показывающее высокую эффективность нового биомаркера и общей модели в прогнозировании ранних стадий АМД. Эти результаты демонстрируют перспективу AMD-Mamba для совершенствования прогнозирования и профилактики этого заболевания.
Annotation:
Age-related macular degeneration (AMD) is a leading cause of irreversible vision loss, making effective prognosis crucial for timely intervention. In this work, we propose AMD-Mamba, a novel multi-modal framework for AMD prognosis, and further develop a new AMD biomarker. This framework integrates color fundus images with genetic variants and socio-demographic variables. At its core, AMD-Mamba introduces an innovative metric learning strategy that leverages AMD severity scale score as prior know...
ID: 2508.02957v1 eess.IV, cs.CV
Авторы:

Tongxu Zhang, Zhiming Liang, Bei Wang

**Резюме** Точечные облака становятся важной репрезентацией в 3D-медицинской импровизации, предлагая компактное и сохраняющее поверхность средство замены традиционных методов на основе вокселей или сетках. Недавние достижения в глубоком обучении позволяют эффективно извлекать, моделировать и анализировать анатомические формы из точечных облаков данных. В данной систематической свертке рассматриваются подходы к обучению с точечных облаков медицинских данных в трех основных областях: регистрация, восстановление и моделирование вариаций. Обзор покрывает работы за период 2021—2025 годов, изложенных методологии, датасеты и критерии оценки, а также клинические приложения и вызовы, связанные с медицинскими характеристиками этого направления. Отмечены тенденции, такие как объединение гибридных представлений, развитие самостоятельных моделей на больших объемах данных и генеративные технологии. Также обозначены ограничения, включая недостаток данных, пациентскую различимость и потребность в интерпретируемых и надежных решениях для клинического применения. В качестве перспектив развития указано формирование более сложных моделей для улучшения точности и применимости в медицинской импровизации.
Annotation:
Point clouds have become an increasingly important representation for 3D medical imaging, offering a compact, surface-preserving alternative to traditional voxel or mesh-based approaches. Recent advances in deep learning have enabled rapid progress in extracting, modeling, and analyzing anatomical shapes directly from point cloud data. This paper provides a comprehensive and systematic survey of learning-based shape analysis for medical point clouds, focusing on three fundamental tasks: registra...
ID: 2508.03057v1 eess.IV, cs.CV
Авторы:

Bo Zhang, JianFei Huo, Zheng Zhang, Wufan Wang, Hui Gao, Xiangyang Gong, Wendong Wang

Задача суперрезолюции медицинских изображений с произвольными разрешениями (ARSR) является важной для лучшего анализа медицинских снимков, но существующие CNN-методы страдают от невозможности адаптации к произвольным множителям масштабирования. INR-методы решают эту проблему, однако сталкиваются с трудностями в обработке многомодальных изображений с разными разрешениями и деталями. Мы предлагаем Nexus-INR — новую систему ARSR, основанную на семантических знаниях, которая объединяет различные источники знаний и задачи для повышения качества суперрезолюции. Она включает двухвинковую энкодерную структуру с задачей классификации для разделения общих и модально-специфических признаков, модуль классификации с использованием кросс-модального внимания для улучшения реконструкции низкого разрешения с помощью высокого, и интегрированный модуль сегментации для улучшения качества реконструкции и сводных задач. На данных BraTS2020 мы показали, что Nexus-INR превосходит состояние искусства по многим показателям.
Annotation:
Arbitrary-resolution super-resolution (ARSR) provides crucial flexibility for medical image analysis by adapting to diverse spatial resolutions. However, traditional CNN-based methods are inherently ill-suited for ARSR, as they are typically designed for fixed upsampling factors. While INR-based methods overcome this limitation, they still struggle to effectively process and leverage multi-modal images with varying resolutions and details. In this paper, we propose Nexus-INR, a Diverse Knowledge...
ID: 2508.03073v1 eess.IV, cs.CV
Авторы:

Yifei Sun, Zhanghao Chen, Hao Zheng, Yuqing Lu, Lixin Duan, Fenglei Fan, Ahmed Elazab, Xiang Wan, Changmiao Wang, Ruiquan Ge

Задача бонсупрессии в CXR изображениях является важной для повышения точности диагностики, однако существующие методы сталкиваются с проблемами балансировки удаления кисти и сохранения локальных деталей. Мы предлагаем Global-Local Latent Consistency Model (GL-LCM), архитектуру, которая объединяет сегментацию лёгких, двухпутное отсканирование и глобально-локальную консолидацию. GL-LCM эффективно уменьшает видимость кисти, сохраняет локальные детали и обеспечивает высокую скорость обработки. Для устранения проблемы размытия и артефактов на границах мы предлагаем Local-Enhanced Guidance, который не требует дополнительной тренировки. Эксперименты на SZCH-X-Rays и JSRT показали, что GL-LCM превосходит конкуренты по качеству и производительности, делая его применимым в клинических условиях.
Annotation:
Chest X-Ray (CXR) imaging for pulmonary diagnosis raises significant challenges, primarily because bone structures can obscure critical details necessary for accurate diagnosis. Recent advances in deep learning, particularly with diffusion models, offer significant promise for effectively minimizing the visibility of bone structures in CXR images, thereby improving clarity and diagnostic accuracy. Nevertheless, existing diffusion-based methods for bone suppression in CXR imaging struggle to bala...
ID: 2508.03357v1 eess.IV, cs.CV
Авторы:

Gideon N. L. Rouwendaal, Daniël Boeke, Inge L. Cox, Henk G. van der Poel, Margriet C. van Dijk-de Haan, Regina G. H. Beets-Tan, Thierry N. Boellaard, Wilson Silva

Оценка предварительной реферированной версии статьи: **Проблема:** Установлено, что клинические признаки являются наиболее важными для прогнозирования эректильной дисфункции (ED) после радикального простатэктомии. Однако неясно, добавляет ли предварительная магнитно-резонансная импеданометрия (MRI) дополнительный принципиальный принцип прогнозирования ED и может ли она использоваться вместе с клиническими данными в многомодальных моделях. **Решение:** Были проанализированы модели, основывающиеся на клинических данных, анатомических фичи, глубоких нейросетевых моделях, а также мультимодальные модели, которые объединяли клинические и изображения MRI. **Основные выводы:** Модели, основывающиеся только на клинических данных, показали наилучшую прогностическую силу (AUC 0.663). Нейронные сети, работающие напрямую с изображениями MRI, дали незначительное улучшение (AUC 0.569), но не превосходили клинических моделей. Мультимодальные подходы с минимальным приростем (AUC 0.586) также не превосходили клинический базовый вариант. Анализ SHAP подтвердил, что клинические признаки играют ключевую роль в прогнозировании ED. Несмотря на недостатки, изображения MRI подразумевают возможность в будущем включить анатомические фичи в комбинированные модели для более точного прогнозирования.
Annotation:
Accurate preoperative prediction of erectile dysfunction (ED) is important for counseling patients undergoing radical prostatectomy. While clinical features are established predictors, the added value of preoperative MRI remains underexplored. We investigate whether MRI provides additional predictive value for ED at 12 months post-surgery, evaluating four modeling strategies: (1) a clinical-only baseline, representing current state-of-the-art; (2) classical models using handcrafted anatomical fe...
ID: 2508.03461v1 eess.IV, cs.CV
Авторы:

Ana Lawry Aguila, Ayodeji Ijishakin, Juan Eugenio Iglesias, Tomomi Takenaga, Yukihiro Nomura, Takeharu Yoshikawa, Osamu Abe, Shouhei Hanaoka

Нормативные модели, использующие машинное обучение для обнаружения патологий в больших медицинских данных, становятся важной частью анализа нейроизображений. Однако применение этих моделей к реальным клиническим данным, подверженным неоднородности и артефактам, сопряжено с значительными сложностями. Модели основанные на диффузионном моделировании, хотя и показывают высокую точность, зачастую не учитывают клинический контекст, что может привести к неточным выводам. Мы предлагаем CADD — первую кондиционированную диффузионную модель для нормативного моделирования в 3D-изображениях. Метод CADD использует информацию о нормальных девиациях для улучшения восстановления здоровых областей изображений, что позволяет более точно выделять аномалии, связанные с болезнью. На трех клинических наборах данных, включая изображения с низким контрастом и артефактами, CADD показал значительное улучшение точности обнаружения болезней в сравнении с современными моделями. Это решение демонстрирует значительное потенциал для реальных клинических применений.
Annotation:
Applying machine learning to real-world medical data, e.g. from hospital archives, has the potential to revolutionize disease detection in brain images. However, detecting pathology in such heterogeneous cohorts is a difficult challenge. Normative modeling, a form of unsupervised anomaly detection, offers a promising approach to studying such cohorts where the ``normal'' behavior is modeled and can be used at subject level to detect deviations relating to disease pathology. Diffusion models have...
ID: 2508.03594v1 eess.IV, cs.CV
Авторы:

Jinwei Zhang, Lianrui Zuo, Blake E. Dewey, Samuel W. Remedios, Yihao Liu, Savannah P. Hays, Dzung L. Pham, Ellen M. Mowry, Scott D. Newsome, Peter A. Calabresi, Aaron Carass, Jerry L. Prince

**Резюме** Segmentation неопределенных зон в неврологических MR-изображениях — важная задача, требующая точности и репродуцируемости. Несмотря на прогресс в deep learning (DL), многие методы сталкиваются с проблемой недостаточной общей обобщающей способности при обучении на ограниченных данных. Мы предлагаем метод UNISELF, который комбинирует инновационную тестовую самоensemble-функцию для мозаичной обработки и новую тестовую нормализацию слоев (TTIN) для устранения ограничений в доступных входных контрастов. Эта архитектура позволяет UNISELF достичь высокой точности в задаче сегментации неопределенных зон неврологических MR-изображений, обеспечивая значительное улучшение качества сравнения с текущими методами. Для подтверждения его эффективности, UNISELF показал оптимальные результаты на ISBI 2015 и других соревновательных тестовых наборах, включая MICCAI 2016 и UMCL. Наш код доступен на GitHub по адресу https://github.com/uponacceptance.
Annotation:
Automated segmentation of multiple sclerosis (MS) lesions using multicontrast magnetic resonance (MR) images improves efficiency and reproducibility compared to manual delineation, with deep learning (DL) methods achieving state-of-the-art performance. However, these DL-based methods have yet to simultaneously optimize in-domain accuracy and out-of-domain generalization when trained on a single source with limited data, or their performance has been unsatisfactory. To fill this gap, we propose a...
ID: 2508.03982v1 eess.IV, cs.CV
Авторы:

Yichi Zhang, Wenbo Zhang, Zehui Ling, Gang Feng, Sisi Peng, Deshu Chen, Yuchen Liu, Hongwei Zhang, Shuqi Wang, Lanlan Li, Limei Han, Yuan Cheng, Zixin Hu, Yuan Qi, Le Xue

**Резюме** Positron emission tomography (PET) является важной методикой в онкологии и неврологии, позволяющей изучать метаболические процессы. Однако создание медицинских отчетов для PET-исследований вручную требует много времени и труда. В этой работе предлагается PET2Rep — первый бенчмарк, специально разработанный для оценки мощности визуально-языковых моделей (VLMs) в автоматизации генерации отчетов для PET-исследований. Он включает в себя сотни тысяч whole-body image-report pairs, охватывающих многие органы и чрезвычайно важные метаболические свойства. Мы сравнили 30 моделей, обнаружив, что даже лучшие VLMs сегодняшнего дня добиваются низкого качества в результатах, не соответствующем практическим потребностям. Основными проблемами, выявленными в исследовании, являются недостаточное понимание метаболического контента и ограниченность обучения моделей на реальных клинических данных. Наш эксперимент направлен на подчеркнуть необходимость развития специализированных моделей и дальнейшего исследования в этой области.
Annotation:
Positron emission tomography (PET) is a cornerstone of modern oncologic and neurologic imaging, distinguished by its unique ability to illuminate dynamic metabolic processes that transcend the anatomical focus of traditional imaging technologies. Radiology reports are essential for clinical decision making, yet their manual creation is labor-intensive and time-consuming. Recent advancements of vision-language models (VLMs) have shown strong potential in medical applications, presenting a promisi...
ID: 2508.04062v1 eess.IV, cs.CV
Авторы:

Ethan Dack, Lorenzo Brigato, Vasilis Dedousis, Janine Gote-Schniering, Cheryl, Hanno Hoppe, Aristomenis Exadaktylos, Manuela Funke-Chambour, Thomas Geiser, Andreas Christe, Lukas Ebner, Stavroula Mougiakakou

**Резюме** Интерстициальные болезни легких (ILD) широко распространены, но диагностика их часто становится сложной из-за нехватки больших лабораторно отмеченных наборов данных. Масообучение (Masked Autoencoders, MAE) — мощный подход к созданию информативных представлений, особенно при ограниченных теггированных данных. Мы предлагаем использовать MAE для обучения модели на 5000+ полотен CT-сканов, объединив внутренние с уже существующими открытыми базами, связанными с COVID-19 и бактериальной пневмонией. Эта модель позже была применена для классификации ILD. Наши результаты показывают, что MAE могут эффективно извлекать клинически значимые признаки, даже в условиях нехватки меток. Надеемся, что наша работа поможет в улучшении диагностики и исследовании ILD. Исходный код и модели доступны на GitHub: https://github.com/eedack01/lung_masked_autoencoder.
Annotation:
Masked autoencoders (MAEs) have emerged as a powerful approach for pre-training on unlabelled data, capable of learning robust and informative feature representations. This is particularly advantageous in diffused lung disease research, where annotated imaging datasets are scarce. To leverage this, we train an MAE on a curated collection of over 5,000 chest computed tomography (CT) scans, combining in-house data with publicly available scans from related conditions that exhibit similar radiologi...
ID: 2508.04429v1 eess.IV, cs.CV
Показано 251 - 260 из 268 записей