📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Clinically-guided Data Synthesis for Laryngeal Lesion Detection

2025-08-12

Авторы:

Chiara Baldini, Kaisar Kushibar, Richard Osuala, Simone Balocco, Oliver Diaz, Karim Lekadir, Leonardo S. Mattos

## Контекст Отрасль оториноларингологии сталкивается с ограниченными возможностями в использовании компьютерного зрения для диагностики и оценки заболеваний. Одним из ключевых ограничений является нехватка высококачественных тренировочных данных, представляющих разнообразие клинических ситуаций. Это нарушает эффективность существующих систем компьютерной помощи в диагностике (CADx) и детекции (CADe), которые требуют больших наборов данных для обучения и тестирования. Основные проблемы включают нехватку разнообразия в данных, высокую разнообразию и сложность признаков заболеваний, а также высокую зависимость от опыта оператора. Несмотря на достижения в CADx/e, эти системы все еще не достаточно широко применяются в практике, что приводит к необходимости развития методов, которые могут улучшить качество и надежность диагностики в оториноларингологии. ## Метод В этой работе предлагается использовать Latent Diffusion Model (LDM) с ControlNet adapter для генерации синтетических изображений изображений гортани, аннотированных клиническими данными. Метод строится на основе модели LDM, которая использует процесс диффузии для генерации реалистичных изображений, кондиционированных на клинические признаки. ControlNet adapter позволяет управлять этим процессом, чтобы генерировать изображения с клинически важными признаками. Этот подход решает проблему нехватки данных, расширяя наборы тренировочных данных для CADx/e. Использованные данные включают реальные изображения гортани, откуда были сгенерированы синтетические аналоги с клиническими признаками, чтобы улучшить качество моделей диагностики. ## Результаты В экспериментах были проведены тесты на различных данных, включая реальные и синтетические изображения. Добавление 10% синтетических данных улучшило точность детекции заболеваний на 9% во внутреннем тестировании и на 22.1% во внешнем тестировании. Кроме того, специалисты по оториноларингологии оценили реализм сгенерированных изображений, выбирая, рассматривают ли они их как реальные или синтетические. Результаты показали, что синтетические данные были сбалансированы и реалистичными, что подтвердило их качество и полезность в тренировочных наборах данных. ## Значимость Предложенный подход может быть применен в различных областях, где нехватка данных является критическим ограничением для развития систем CADx/e. Он демонстрирует возможность использования синтетических данных для расширения наборов тренировочных данных и улучшения точности диагностики. Это может привести к более доступным и надежным системам диагностики для оториноларингологии, снижая зависимость от опыта оператора и ра

Annotation:

Although computer-aided diagnosis (CADx) and detection (CADe) systems have made significant progress in various medical domains, their application is still limited in specialized fields such as otorhinolaryngology. In the latter, current assessment methods heavily depend on operator expertise, and the high heterogeneity of lesions complicates diagnosis, with biopsy persisting as the gold standard despite its substantial costs and risks. A critical bottleneck for specialized endoscopic CADx/e sys...

ID: 2508.06182v1 eess.IV, cs.CV

arXiv PDF

📄 Multivariate Fields of Experts

2025-08-12

Авторы:

Stanislas Ducotterd, Michael Unser

#### Контекст В области обработки изображений и реконструкции изображений существует необходимость в мощных и эффективных моделях, которые могут решать вызовы, связанные с поиском признаков, восстановлением и декодированием. Одним из ключевых задач для этих приложений является разработка эффективных моделей признаков, которые могут оптимально описывать структуру изображений. Традиционно, такие модели строятся на основе нейронных сетей, но они часто требуют больших объемов данных и ресурсов для обучения. В этой работе предлагается новый подход, Multivariate Fields of Experts, который предназначен для улучшения точности и надежности решений в обработке изображений. #### Метод Модель Multivariate Fields of Experts основывается на создании нового класса потенциальных функций, которые используют **Moreau envelopes** $\ell_\infty$-нормы. Это позволяет интегрировать многомерные зависимости в модель, что делает ее более сложной, но также более точной для представления сложных структур изображений. Метод включает в себя несколько стадий: 1. **Построение потенциальных функций**: Используется Moreau envelope, чтобы добиться более разреженных и точных представлений. 2. **Многомерное моделирование**: Новая архитектура включает в себя несколько моделей, которые работают совместно для обеспечения более глубокого и точного представления изображений. 3. **Оптимизация**: Используется адаптивная оптимизация для обучения модели, чтобы минимизировать ошибки реконструкции. Эта архитектура позволяет модели Multivariate Fields of Experts оптимально использовать все доступные сведения о изображении, улучшая эффективность и точность решений. #### Результаты Результаты экспериментов показывают, что Multivariate Fields of Experts эффективно работает на различных задачах: - **Image Denoising**: Модель достигла лучшей точности по сравнению с базовыми подходами, удаляя шум более точно и сохраняя достоверность деталей. - **Image Deblurring**: Модель восстановила разрешенное изображение, избавившись от размытия, при этом сохранив размеры и формы объектов. - **Compressed-Sensing MRI и CT**: В области магнитной резонансной зондки и вычислительной томографии метод показал высокую точность в восстановлении изображений, сократив время расчетов и требуя меньше ресурсов. По сравнению с другими методами, в том числе действительно нейронными моделями, Multivariate Fields of Experts показала скорость работы и эффективность, особенно при малом количестве данных для обучения. #### Значимость Модель Multivariate Fields of Experts обладает широкими областями применения: - **Медицинская импровизация**: Улучшение точности восстановления изображений в медицинских сканерах. - **Реконструкция изображений**: Улучшение качества изображений в ситуациях, где данные ограничен

Annotation:

We introduce the multivariate fields of experts, a new framework for the learning of image priors. Our model generalizes existing fields of experts methods by incorporating multivariate potential functions constructed via Moreau envelopes of the $\ell_\infty$-norm. We demonstrate the effectiveness of our proposal across a range of inverse problems that include image denoising, deblurring, compressed-sensing magnetic-resonance imaging, and computed tomography. The proposed approach outperforms co...

ID: 2508.06490v1 eess.IV, cs.CV, cs.LG, eess.SP

arXiv PDF

📄 FUTransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

2025-08-09

Авторы:

Akwasi Asare, Mary Sagoe, Justice Williams Asare

Авторы предлагают FUTransUNet-GradCAM, гибридную архитектуру, объединяющую Vision Transformer (ViT) и U-Net, для точного сегментирования диабетических лакательных порезов (DFU). Исследование выделяет трудности в сегментации DFU, включая их нетипичное появление, неоднородный фон и сложности в использовании CNN, ограниченных рецепторными полями. FUTransUNet использует трансформерную самоп paюющуюся внимания для эффективного доставления глобальных контекста и изящной частной детализации, оптимизированной skip-подключениями. Модель обучалась и валидировалась на FUSeg датасете, показывая Dice Coefficient 0.8679 и IoU 0.7672 в тренировке, а на валидации — 0.8751 и 0.7780 соответственно. Для ясности интерпретации предлагают Grad-CAM заметки, показывающие, где модель сосредотачивается при предсказании. Эффективность и трансляционный потенциал FUTransUNet-GradCAM демонстрируются, чтобы улучшить анализ и лечение DFU в реальных условиях.

Annotation:

Automated segmentation of diabetic foot ulcers (DFUs) plays a critical role in clinical diagnosis, therapeutic planning, and longitudinal wound monitoring. However, this task remains challenging due to the heterogeneous appearance, irregular morphology, and complex backgrounds associated with ulcer regions in clinical photographs. Traditional convolutional neural networks (CNNs), such as U-Net, provide strong localization capabilities but struggle to model long-range spatial dependencies due to ...

ID: 2508.03758v1 eess.IV, cs.CV

arXiv PDF

📄 Assessing the Impact of Image Super Resolution on White Blood Cell Classification Accuracy

2025-08-09

Авторы:

Tatwadarshi P. Nagarhalli, Shruti S. Pawar, Soham A. Dahanukar, Uday Aswalekar, Ashwini M. Save, Sanket D. Patil

В научной статье проводится исследование влияния увеличения разрешения изображений на точность классификации белков крови с использованием глубоких нейронных сетей. Низкое разрешение микроскопических изображений часто мешает точному распознаванию, поэтому исследователи применяют технологию суперразрешения для улучшения качества изображений. Для экспериментов используется модель классификации, обученная на стандартных и улучшенных данных. Результаты показывают, что применение суперразрешения повышает точность классификации, позволяя модели обнаруживать тонкие морфологические отличия в клеточных структурах. Исследование продемонстрировало, что увеличение разрешения не только повышает точность, но и улучшает обучение модели, обеспечивая более точное распознавание в медицинских приложениях. Основным выводом является, что суперразрешение может стать ключевым инструментом для повышения точности классификации белков крови в контексте медицинского диагностического анализа.

Annotation:

Accurately classifying white blood cells from microscopic images is essential to identify several illnesses and conditions in medical diagnostics. Many deep learning technologies are being employed to quickly and automatically classify images. However, most of the time, the resolution of these microscopic pictures is quite low, which might make it difficult to classify them correctly. Some picture improvement techniques, such as image super-resolution, are being utilized to improve the resolutio...

ID: 2508.03759v1 eess.IV, cs.CV, cs.LG, q-bio.QM

arXiv PDF

📄 GR-Gaussian: Graph-Based Radiative Gaussian Splatting for Sparse-View CT Reconstruction

2025-08-09

Авторы:

Yikuang Yuluo, Yue Ma, Kuan Shen, Tongtong Jin, Wang Liao, Yangpu Ma, Fuquan Wang

**Резюме** Графическая модель 3D Gaussian Splatting (3DGS) показала себя как эффективный подход для реконструкции данных в компьютерной томографии (CT). Однако существующие реализации этой модели страдают от значительных недостатков при работе с недостаточно высоким числом проекций (sparse-view conditions), в частности, выявляются сильные горизонтальные искажения (needle-like artifacts). Для решения этой проблемы предлагается GR-Gaussian — новая архитектура, основанная на графах и радиусных проекциях, которая уменьшает ошибки инициализации и улучшает точность реконструкции. Основные инновации включают: (1) стратегию инициализации точек, снижающую начальные ошибки и ускоряющую сходимость; и (2) адаптивную стратегию вычисления градиентов, оптимизирующую распределение плотности и улучшающую сплитинг. Анализ на данных X-3D и реальных CT снимках показал, что GR-Gaussian существенно повышает PSNR (до 0.67 dB) и SSIM (до 0.021), демонстрируя свою высокую эффективность для решения задачи реконструкции CT в условиях недостаточного числа проекций.

Annotation:

3D Gaussian Splatting (3DGS) has emerged as a promising approach for CT reconstruction. However, existing methods rely on the average gradient magnitude of points within the view, often leading to severe needle-like artifacts under sparse-view conditions. To address this challenge, we propose GR-Gaussian, a graph-based 3D Gaussian Splatting framework that suppresses needle-like artifacts and improves reconstruction accuracy under sparse-view conditions. Our framework introduces two key innovatio...

ID: 2508.02408v2 eess.IV, cs.CV

arXiv PDF

📄 Identifying actionable driver mutations in lung cancer using an efficient Asymmetric Transformer Decoder

2025-08-09

Авторы:

Biagio Brattoli, Jack Shi, Jongchan Park, Taebum Lee, Donggeun Yoo, Sergio Pereira

Определение клинически значимых драйверных мутаций в нескольких институциональных экземплярах нескольких типов рака лёгких (NSCLC) может существенно повлиять на выбор терапии и повысить результаты лечения. Однако широкое применение генетических тестов ограничено доступностью и долгими временными шкалами. Машинное обучение (ML) в области вычислительной патологии (CPath) предлагает решение, но многие исследования ограничиваются одной или двумя обычными мутациями, ограничивая клиническую ценность. В этом исследовании мы применяем технологию Multiple Instance Learning (MIL) для определения шести актуальных мутаций NSCLC: ALK, BRAF, EGFR, ERBB2, KRAS и MET ex14. Мы предлагаем Asymmetric Transformer Decoder с запросами и ключевыми значениями различных размеров, что позволяет эффективно извлекать информацию из патчей и снижать риск переобучения. Также мы представляем метод, использующий тип ткани напрямую в модели, что решает проблему MIL, когда либо все, либо только некоторые области анализируются, не принимая во внимание биологическую релевантность. Наш подход показал средний выигрыш в 3% по отношению к топ-MIL-моделям и до 4% при предсказании редких мутаций BRAF и ERBB2, приближая ML-тесты к полноценным аналогам генетических тестов.

Annotation:

Identifying actionable driver mutations in non-small cell lung cancer (NSCLC) can impact treatment decisions and significantly improve patient outcomes. Despite guideline recommendations, broader adoption of genetic testing remains challenging due to limited availability and lengthy turnaround times. Machine Learning (ML) methods for Computational Pathology (CPath) offer a potential solution; however, research often focuses on only one or two common mutations, limiting the clinical value of thes...

ID: 2508.02431v2 eess.IV, cs.CV

arXiv PDF

📄 From Pixels to Pathology: Restoration Diffusion for Diagnostic-Consistent Virtual IHC

2025-08-09

Авторы:

Jingsong Liu, Xiaofeng Deng, Han Li, Azar Kazemi, Christian Grashei, Gesa Wilkens, Xin You, Tanja Groll, Nassir Navab, Carolin Mogler, Peter J. Schüffler

Оценка маркеров в клетках через иммуногистохимический анализ (IHC) важно для диагностики и лечения рака, но этот процесс затратен и требует много времени. Альтернативой является виртуальное статирование — трансформация типовых H&E-выкладок в IHC-выкладки с помощью искусственных нейронных сетей. Однако существуют две проблемы: необходимость сравнения синтетических изображений с неидеальными IHC-оригиналами и сохранение биологической разнообразности при преобразовании. Мы предлагаем Star-Diff, модель diffusion-based, которая решает эти задачи, сохраняя ткачественную структуру и моделируя видоизменения маркеров. Для оценки результатов мы предложили Semantic Fidelity Score (SFS), метрику, основанную на классификации маркеров, которая эффективна даже при недостаточном выравнивании изображений. Star-Diff показала лучшие результаты в SOTA на датасете BCI, демонстрируя промышленную применимость для виртуального IHC во время операции.

Annotation:

Hematoxylin and eosin (H&E) staining is the clinical standard for assessing tissue morphology, but it lacks molecular-level diagnostic information. In contrast, immunohistochemistry (IHC) provides crucial insights into biomarker expression, such as HER2 status for breast cancer grading, but remains costly and time-consuming, limiting its use in time-sensitive clinical workflows. To address this gap, virtual staining from H&E to IHC has emerged as a promising alternative, yet faces two core chall...

ID: 2508.02528v1 eess.IV, cs.CV

arXiv PDF

📄 Scaling Artificial Intelligence for Prostate Cancer Detection on MRI towards Population-Based Screening and Primary Diagnosis in a Global, Multiethnic Population (Study Protocol)

2025-08-09

Авторы:

Anindo Saha, Joeran S. Bosma, Jasper J. Twilt, Alexander B. C. D. Ng, Aqua Asif, Kirti Magudia, Peder Larson, Qinglin Xie, Xiaodong Zhang, Chi Pham Minh, Samuel N. Gitau, Ivo G. Schoots, Martijn F. Boomsma, Renato Cuocolo, Nikolaos Papanikolaou, Daniele Regge, Derya Yakar, Mattijs Elschot, Jeroen Veltman, Baris Turkbey, Nancy A. Obuchowski, Jurgen J. Fütterer, Anwar R. Padhani, Hashim U. Ahmed, Tobias Nordström, Martin Eklund, Veeru Kasivisvanathan, Maarten de Rooij, Henkjan Huisman

**Резюме** В статье предлагается метод скалирования искусственного интеллекта (AI) для повышения точности диагностики простаты канцера (PCa) на MRI в рамках глобального многоэтнического исследования. Авторы развивают модель PI-CAI-2B, расширенную версию современной AI-системы, ранее созданной для обнаружения Gleason grade group ≥2 PCa на MRI. Исследование включает отбор данных из 22,481 MRI-исследований, полученных у 21,288 пациентов в 46 городах 22 стран. 20,471 случая используются для тренировки и внутреннего тестирования, а 2,010 случаев — для внешнего тестирования на масштабных программах скрининга (напр., STHLM3-MRI) и принципиальных диагностических назначениях (напр., PRIME). Основной критерий оценки — согласия с клиническими диагнозами, основанными на histopathology или оценках двух консультантов-урогенитальных радиологов. Авторы также проверяют уровни биазы в зависимости от качества имеджинга, возраста и этнического происхождения пациента. Ожидается, что данный подход способен стать оптимальным решением для эффективного AI-ориентированного скрининга PCa на масштабе мирового общества.

Annotation:

In this intercontinental, confirmatory study, we include a retrospective cohort of 22,481 MRI examinations (21,288 patients; 46 cities in 22 countries) to train and externally validate the PI-CAI-2B model, i.e., an efficient, next-generation iteration of the state-of-the-art AI system that was developed for detecting Gleason grade group $\geq$2 prostate cancer on MRI during the PI-CAI study. Of these examinations, 20,471 cases (19,278 patients; 26 cities in 14 countries) from two EU Horizon proj...

ID: 2508.03762v1 eess.IV, cs.CV

arXiv PDF

📄 RL-U$^2$Net: A Dual-Branch UNet with Reinforcement Learning-Assisted Multimodal Feature Fusion for Accurate 3D Whole-Heart Segmentation

2025-08-09

Авторы:

Jierui Qu, Jianchun Zhao

Целью данной работы является развитие эффективного метода для точной трехмерной сегментации всего сердца, используя многомодальные данные, включающие компьютерную томографию (CT) и магнитно-резонансную импульсную интервьюю (MRI). Основные проблемы в существующих методах заключаются в серьезных проблемах консистентности между модальностями, жестких статических стратегиях слияния признаков и разделенных процессов анализа признаков и сегментации. Разработанная RL-U$^2$Net предлагает двойное U-образное сетевое архитектура, использующее вспомогательный модуль RL-XAlign c кросс-модальным вниманием и алгоритмом на основе управляемого обучения, чтобы добиться более точной и эффективной интеграции признаков. Работа показала, что RL-U$^2$Net достигает высокой точности (Dice = 93.1% для CT и Dice = 87.0% для MRI), что демонстрирует его преимущества перед современными методами в этой области.

Annotation:

Accurate whole-heart segmentation is a critical component in the precise diagnosis and interventional planning of cardiovascular diseases. Integrating complementary information from modalities such as computed tomography (CT) and magnetic resonance imaging (MRI) can significantly enhance segmentation accuracy and robustness. However, existing multi-modal segmentation methods face several limitations: severe spatial inconsistency between modalities hinders effective feature fusion; fusion strateg...

ID: 2508.02557v1 eess.IV, cs.CV

arXiv PDF

📄 Evaluation of 3D Counterfactual Brain MRI Generation

2025-08-09

Авторы:

Pengwei Sun, Wei Peng, Lun Yu Li, Yixin Wang, Kilian M. Pohl

**Резюме** В статье рассматривается проблема генерации контрафактных трехмерных МРИ-снимков мозга, нацеленной на понимание механизмов заболеваний и создание реалистичной медицинской имитационной даты. Основные трудности в этой области — недостаточность данных, сложность структуры мозга и отсутствие стандартизированных методов оценки. Авторы предлагают конвертировать шесть моделей генеративного моделирования в 3D-контрафактные подходы, используя анатомически ориентированный фреймворк на основе казуальных графов, где региональные объемы мозга служат входными условиями условной моделирования. Модели оцениваются по критериям композиции, реверсивности, реализму, эффективности и минимальности на наборе данных ADNI и проверяются на NCANDA. Результаты показывают, что анатомическая регулировка успешно изменяет целевые регионы, но слабо сохраняет нецелевые структуры. Работа выделяет необходимость развития новых архитектур, которые более точно охватывают анатомические зависимости.

Annotation:

Counterfactual generation offers a principled framework for simulating hypothetical changes in medical imaging, with potential applications in understanding disease mechanisms and generating physiologically plausible data. However, generating realistic structural 3D brain MRIs that respect anatomical and causal constraints remains challenging due to data scarcity, structural complexity, and the lack of standardized evaluation protocols. In this work, we convert six generative models into 3D coun...

ID: 2508.02880v1 eess.IV, cs.CV

arXiv PDF

Показано 241 - 250 из 268 записей