📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Xuan Loc Pham, Gwendolyn Vuurberg, Marjan Doppen, Joey Roosen, Tip Stille, Thi Quynh Ha, Thuy Duong Quach, Quoc Vu Dang, Manh Ha Luu, Ewoud J. Smit, Hong Son Mai, Mattias Heinrich, Bram van Ginneken, Mathias Prokop, Alessa Hering

**Резюме** Регистрация изображений является ключевым элементом анализа мультифазных и многоорганичных медицинских сканов, однако большинство существующих методов ориентированы на регистрацию отдельных органов, что ограничивает их применение. Мы представляем TotalRegistrator — новую систему регистрации, способную совместно выравнивать несколько органов в рамках одной модели. Она основывается на стандартной UNet-архитектуре с использованием оригинальной стратегии разделения полей, что позволяет значительно сократить требования к GPU-памяти — до 11 ГБ при обучении. Мы обучили TotalRegistrator на большом лабиринте данных со сканами зоны грудной клетки, живота и таза, а также проверили его на трех внешних наборах данных. Результаты показали, что наше решение выполняет регистрацию многоорганичных снимков более эффективно, чем классические и новые генерик-модели, при этом масштабируемость и универсальность системы доказаны на различных внешних наборах. Таким образом, TotalRegistrator представляет собой прорыв в области многоорганичной регистрации медицинских изображений, обладая высокой обобщающей способностью.
Annotation:
Image registration is a fundamental technique in the analysis of longitudinal and multi-phase CT images within clinical practice. However, most existing methods are tailored for single-organ applications, limiting their generalizability to other anatomical regions. This work presents TotalRegistrator, an image registration framework capable of aligning multiple anatomical regions simultaneously using a standard UNet architecture and a novel field decomposition strategy. The model is lightweight,...
ID: 2508.04450v1 eess.IV, cs.CV
Авторы:

Yichi Zhang, Fengqing Zhu

Задача улучшения эффективности кодеков видеокодирования становится все более актуальной в условиях роста требований к качеству видео и ограниченности битрейтов. Одним из перспективных направлений является Deep Contextual Video Compression (DCVC), который использует нейронные сети для повышения эффективности кодирования. Однако ранее доступные реализации DCVC были ограничены возможностями проверки результатов, что затрудняло репликацию исследований и сравнение с другими моделями. В этой работе представлена OpenDCVCs — открытая реализация DCVC на PyTorch, включающая четыре представительских модели DCVC: базовую версию, модель с моделированием временного контекста, с гибридным моделированием энтропии и с использованием разнообразных контекстов. Данная реализация позволяет не только проводить оценку, но и осуществлять полный цикл обучения моделей. Она дополняется документацией, протоколами оценки и результатами сравнения с другими кодеками на разных наборах данных. Это открытие обеспечивает новые возможности для репликации исследований, сравнения алгоритмов и дальнейшего развития DCVC.
Annotation:
We present OpenDCVCs, an open-source PyTorch implementation designed to advance reproducible research in learned video compression. OpenDCVCs provides unified and training-ready implementations of four representative Deep Contextual Video Compression (DCVC) models--DCVC, DCVC with Temporal Context Modeling (DCVC-TCM), DCVC with Hybrid Entropy Modeling (DCVC-HEM), and DCVC with Diverse Contexts (DCVC-DC). While the DCVC series achieves substantial bitrate reductions over both classical codecs and...
ID: 2508.04491v1 eess.IV, cs.CV
Авторы:

Johannes Tischer, Patric Kienast, Marlene Stümpflen, Gregor Kasprian, Georg Langs, Roxane Licandro

Условная атласная модель для сегментации тканей мозга неbornого ребенка (Fetal Brain Atlas Learning for Automatic Tissue Segmentation) решает проблему стандартизации и анализа МРТ изображений мозга неbornого ребенка, которые часто бывают непостоянными в зависимости от возраста беременности, протоколов съемки и степени точности оценки возраста беременности (GA). Метод предлагает генерировать условные, возрастно-специфичные модели, используя нейронные сети с регистрацией и условным дискриминатором. Модель обучалась на 219 MR-снимках неbornого мозга от 21 до 37 недель во втором триместре. Она достигла высокой аккуратности регистрации и точной сегментации шести зон мозга с DSC 86.3%. Благодаря этому, модель позволяет проводить детальный анализ развития мозга неbornого ребенка, дающий более точные траектории роста мозга, и оказывает важное значение для клинических исследований и применений.
Annotation:
Magnetic Resonance Imaging (MRI) of the fetal brain has become a key tool for studying brain development in vivo. Yet, its assessment remains challenging due to variability in brain maturation, imaging protocols, and uncertain estimates of Gestational Age (GA). To overcome these, brain atlases provide a standardized reference framework that facilitates objective evaluation and comparison across subjects by aligning the atlas and subjects in a common coordinate system. In this work, we introduce ...
ID: 2508.04522v1 eess.IV, cs.CV, cs.LG, 68T07 (Primary) 92C50 (Secondary), I.4.9; I.4.6; I.2.0
Авторы:

Franz Thaler, Darko Stern, Gernot Plank, Martin Urschler

**Резюме** Атриальная фибриляция (АФ) — наиболее распространенный вид кардиальных аритмий, для лечения которой может потребоваться аблационная терапия. Зачастую этот вид терапии включает целевую склеивание тканей сердца для предотвращения аритмий. Одним из ключевых элементов такого подхода является точная сегментация здоровой и сгнившей ткани сердца, чтобы создать персонализированные цифровые модели сердца. Однако эта задача оказывается сложной из-за переменного качества изображений LGE-MRI и существенных доменных различий. Мы предлагаем LA-CaRe-CNN — двухступенчатую 2D/3D-архитектуру на основе CNN, которая используется для точной сегментации левого атриума и левой атриальной сгнившей ткани. LA-CaRe-CNN построен на двух этапах: первый этап определяет левое атриум, а второй этап уточняет его сегментацию, используя информацию о сгнившей ткани. Для увеличения разнообразия обучающих данных мы применяем креативные методы усиления аугментации. Наши эксперименты показали, что LA-CaRe-CNN демонстрирует отличные показатели: ДСК 89,21% и АССД 1,6969 мм для левого атриума, а для сгнившей ткани — ДСК 64,59% и Г-ДСК 91,80%. Эти результаты подтверждают мощь алгоритма в подготовке персонализированных моделей сердца и могут способствовать развитию целевой терапии для лечения АФ.
Annotation:
Atrial fibrillation (AF) represents the most prevalent type of cardiac arrhythmia for which treatment may require patients to undergo ablation therapy. In this surgery cardiac tissues are locally scarred on purpose to prevent electrical signals from causing arrhythmia. Patient-specific cardiac digital twin models show great potential for personalized ablation therapy, however, they demand accurate semantic segmentation of healthy and scarred tissue typically obtained from late gadolinium enhance...
ID: 2508.04553v1 eess.IV, cs.CV, cs.LG
Авторы:

MD Shaikh Rahman, Feiroz Humayara, Syed Maudud E Rabbi, Muhammad Mahbubur Rashid

**Резюме** В статье предлагается расширенная разработка системы контент-базированного поиска маммографических изображений, ориентированной на точный классификационный матчинг по системе BIRADS, включающей пять классов. Это решение призвано устранить существующие ограничения в текущих исследованиях, такие как недостаточные размеры выборок, неподходящие схемы разбиения данных и недостаточное статистическое взаимосвязи, которые мешают клиническому применению. Разработанная фреймворк включает стратифицированное разбиение данных (50%/20%/30% для обучения, валидации и тестирования), регрессионные тесты с помощью штрих-кода, и 602 запросов для поиска. Использованы такие CNN-архитектуры, как DenseNet121, ResNet50 и VGG16, с развитыми тренировочными стратегиями, включая пунктуальное увеличение уровня точности, метрическое обучение и свертки в супер-конфигурации. Наиболее выдающимся результатом явился супер-конфигурация, которая достигла 36.33% precision@10 (95% CI: [34.78%, 37.88%]), что превосходит реалистические ожидания для 5-классового поиска BIRADS. Доказано, что этот подход представляет более эффективные архитектуры для клинического применения в диагностике и качественном контроле.
Annotation:
Content-based mammographic image retrieval systems require exact BIRADS categorical matching across five distinct classes, presenting significantly greater complexity than binary classification tasks commonly addressed in literature. Current medical image retrieval studies suffer from methodological limitations including inadequate sample sizes, improper data splitting, and insufficient statistical validation that hinder clinical translation. We developed a comprehensive evaluation framework sys...
ID: 2508.04790v1 eess.IV, cs.CV, cs.LG
Авторы:

Suyi Chen, Haibin Ling

Определение 3D-структуры белка с помощью крио-эмиссионной микроскопии (cryo-EM) является ключевым заданием в структурной биологии. Однако этот процесс часто сталкивается с проблемами, такими как необходимость внешних инициализационных моделей. Мы предлагаем CryoGS, метод, объединяющий принципы Gaussian Splatting с физикой изображений cryo-EM. Наш подход включает в себя orthogonal projection-aware Gaussian splatting с учетом адаптивных нормализационных терминов и FFT-системы координат. Это позволяет проводить гомогенную реконструкцию 3D-модели белка напрямую из неотфильтрованных данных cryo-EM с эффективным интерпретационным представлением. Мы проверили CryoGS на реальных данных, показав его высокую устойчивость и эффективность по сравнению с традиционными методами. Наше решение обеспечивает продвинутый подход к self-contained cryo-EM реконструкции, облегчая и улучшая этот важный аспект структурной биологии.
Annotation:
As a critical modality for structural biology, cryogenic electron microscopy (cryo-EM) facilitates the determination of macromolecular structures at near-atomic resolution. The core computational task in single-particle cryo-EM is to reconstruct the 3D electrostatic potential of a molecule from a large collection of noisy 2D projections acquired at unknown orientations. Gaussian mixture models (GMMs) provide a continuous, compact, and physically interpretable representation for molecular density...
ID: 2508.04929v1 eess.IV, cs.CV
Авторы:

Caner Özer, Patryk Rygiel, Bram de Wilde, İlkay Öksüz, Jelmer M. Wolterink

Артефакты в медицинских изображениях значительно снижают точность диагностики и сокращают качество анализа данных. Обычные методы обнаружения артефактов часто приводят к убытку информации и требуют большой памяти, что ограничивает модели классификации в своей масштабируемости. В этой работе предлагается использовать алгоритмы implicit neural representations (INRs) для оценки качества медицинских изображений. INRs представляют изображения в виде непрерывных данных, что позволяет легко адаптироваться к разным разрешениям и объемам, уменьшая необходимую память. Мы разработали нейронные сети, основанные на весах и графах, а также трансформеры с относительной аттенцией, чтобы использовать INRs для оценки качества изображений. На датасете ACDC, на котором виртуально генерируются артефакты, наш метод продемонстрировал высокую эффективность при оценке качества, при этом требуя меньше параметров.
Annotation:
Artifacts pose a significant challenge in medical imaging, impacting diagnostic accuracy and downstream analysis. While image-based approaches for detecting artifacts can be effective, they often rely on preprocessing methods that can lead to information loss and high-memory-demand medical images, thereby limiting the scalability of classification models. In this work, we propose the use of implicit neural representations (INRs) for image quality assessment. INRs provide a compact and continuous...
ID: 2508.05168v1 eess.IV, cs.CV
Авторы:

Ruben T. Lucassen, Marjanna Romers, Chiel F. Ebbelaar, Aia N. Najem, Donal P. Hayes, Antien L. Mooyaart, Sara Roshani, Liliane C. D. Wynaendts, Nikolas Stathonikos, Gerben E. Breimer, Anne M. L. Jansen, Mitko Veta, Willeke A. M. Blokx

Spitz-туморы широко известны своей диагностической сложностью, в связи с чем исследовалось потенциало AI-моделей в различных ситуациях. Исследование анализировало 393 Spitz-туморов и 379 конвенциональных меланом, сравнивая предсказательную эффективность AI-моделей с четырьмя опытными патологами. AI-модели, основанные на UNI-функциях, показали сильный показатель AUROC (0.95) и достоверность (0.86) при различении Spitz-туморов и меланом, обнаружив генетические аберрации с достоверностью 0.55 против 0.25 в случае случайного предположения. Также был проведен эксперимент, показавший, что AI-рекомендации могут уменьшить стоимость материалов, время отклика и диагностические исследования. Общий вывод: AI-модели достигли высокой точности в дифференциации Spitz-туморов и меланом, что демонстрирует их потенциал для улучшения диагностики.
Annotation:
Spitz tumors are diagnostically challenging due to overlap in atypical histological features with conventional melanomas. We investigated to what extent AI models, using histological and/or clinical features, can: (1) distinguish Spitz tumors from conventional melanomas; (2) predict the underlying genetic aberration of Spitz tumors; and (3) predict the diagnostic category of Spitz tumors. The AI models were developed and validated using a dataset of 393 Spitz tumors and 379 conventional melanoma...
ID: 2508.05391v1 eess.IV, cs.CV
Показано 261 - 268 из 268 записей