📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Ultra-Strong Gradient Diffusion MRI with Self-Supervised Learning for Prostate Cancer Characterization

2025-12-04

Авторы:

Tanishq Patil, Snigdha Sen, Malwina Molendowska, Kieran G. Foley, Fabrizio Fasano, Mara Cercignani, Marco Palombo, Paddy J. Slator, Eleftheria Panagiotaki

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Diffusion MRI (dMRI) enables non-invasive assessment of prostate microstructure but conventional metrics such as the Apparent Diffusion Coefficient in multiparametric MRI lack specificity to underlying histology. Integrating dMRI with the compartment-based biophysical VERDICT (Vascular, Extracellular, and Restricted Diffusion for Cytometry in Tumours) framework offers richer microstructural insights, though clinical gradient systems (40-80 mT/m) suffer from poor signal-to-noise ratio (SNR) at st...

ID: 2512.03196v1 eess.IV, cs.AI, cs.LG

arXiv PDF

📄 Comparative Evaluation of Generative AI Models for Chest Radiograph Report Generation in the Emergency Department

2025-12-02

Авторы:

Woo Hyeon Lim, Ji Young Lee, Jong Hyuk Lee, Saehoon Kim, Hyungjin Kim

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Purpose: To benchmark open-source or commercial medical image-specific VLMs against real-world radiologist-written reports. Methods: This retrospective study included adult patients who presented to the emergency department between January 2022 and April 2025 and underwent same-day CXR and CT for febrile or respiratory symptoms. Reports from five VLMs (AIRead, Lingshu, MAIRA-2, MedGemma, and MedVersa) and radiologist-written reports were randomly presented and blindly evaluated by three thoracic...

ID: 2512.00271v1 eess.IV, cs.AI, cs.LG

arXiv PDF

📄 Fully Differentiable dMRI Streamline Propagation in PyTorch

2025-11-20

Авторы:

Jongyeon Yoon, Elyssa M. McMaster, Michael E. Kim, Gaurav Rudravaram, Kurt G. Schilling, Bennett A. Landman, Daniel Moyer

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Diffusion MRI (dMRI) provides a distinctive means to probe the microstructural architecture of living tissue, facilitating applications such as brain connectivity analysis, modeling across multiple conditions, and the estimation of macrostructural features. Tractography, which emerged in the final years of the 20th century and accelerated in the early 21st century, is a technique for visualizing white matter pathways in the brain using dMRI. Most diffusion tractography methods rely on procedural...

ID: 2511.14807v1 eess.IV, cs.AI, cs.LG

arXiv PDF

📄 TomoGraphView: 3D Medical Image Classification with Omnidirectional Slice Representations and Graph Neural Networks

2025-11-15

Авторы:

Johannes Kiechle, Stefan M. Fischer, Daniel M. Lang, Cosmin I. Bercea, Matthew J. Nyflot, Lina Felsner, Julia A. Schnabel, Jan C. Peeken

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

The growing number of medical tomography examinations has necessitated the development of automated methods capable of extracting comprehensive imaging features to facilitate downstream tasks such as tumor characterization, while assisting physicians in managing their growing workload. However, 3D medical image classification remains a challenging task due to the complex spatial relationships and long-range dependencies inherent in volumetric data. Training models from scratch suffers from low d...

ID: 2511.09605v1 eess.IV, cs.AI, cs.LG, q-bio.QM

arXiv PDF

📄 Physics-Guided Conditional Diffusion Networks for Microwave Image Reconstruction

2025-10-31

Авторы:

Shirin Chehelgami, Joe LoVetri, Vahab Khoshdel

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

A conditional latent-diffusion based framework for solving the electromagnetic inverse scattering problem associated with microwave imaging is introduced. This generative machine-learning model explicitly mirrors the non-uniqueness of the ill-posed inverse problem. Unlike existing inverse solvers utilizing deterministic machine learning techniques that produce a single reconstruction, the proposed latent-diffusion model generates multiple plausible permittivity maps conditioned on measured scatt...

ID: 2510.25729v1 eess.IV, cs.AI, cs.LG, eess.SP

arXiv PDF

📄 LiteVPNet: A Lightweight Network for Video Encoding Control in Quality-Critical Applications

2025-10-16

Авторы:

Vibhoothi Vibhoothi, François Pitié, Anil Kokaram

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

In the last decade, video workflows in the cinema production ecosystem have presented new use cases for video streaming technology. These new workflows, e.g. in On-set Virtual Production, present the challenge of requiring precise quality control and energy efficiency. Existing approaches to transcoding often fall short of these requirements, either due to a lack of quality control or computational overhead. To fill this gap, we present a lightweight neural network (LiteVPNet) for accurately pre...

ID: 2510.12379v1 eess.IV, cs.AI, cs.LG, cs.MM

arXiv PDF

📄 Deep Active Learning for Lung Disease Severity Classification from Chest X-rays: Learning with Less Data in the Presence of Class Imbalance

2025-09-02

Авторы:

Roy M. Gabriel, Mohammadreza Zandehshahvar, Marly van Assen, Nattakorn Kittisut, Kyle Peters, Carlo N. De Cecco, Ali Adibi

#### Контекст Ранний диагноз и ранняя стадия лечения заболеваний, в том числе легочных, является ключевым фактором успешного лечения и предотвращения серьезных осложнений. Одним из наиболее распространенных средств диагностики являются рентгеновые исследования легких (Chest X-rays, CXRs). Однако традиционный метод диагностики на основе ручного анализа CXRs требует опытных специалистов и значительного времени. Более того, многие больные не имеют доступа к такому диагностическому обслуживанию из-за нехватки квалифицированных специалистов. Дополнительно, классификация заболеваний по тяжести часто сталкивается с проблемой несбалансированных классов в данных, что создает дополнительные затруднения для обучения эффективных моделей. #### Метод В данном исследовании рассматривается deep active learning (ДАЛ) как метод для эффективного обучения моделей с меньшим количеством меток. Использовалась аппроксимация Bayesian Neural Network (BNN) для уменьшения вероятности overfitting и повышения уверенности в прогнозировании. Для обработки несбалансированных классов применялась весовая функция потерь. Модель обучалась с использованием Monte Carlo Dropout, чтобы уменьшить вероятность переобучения и повысить устойчивость модели к шуму. Для выбора самых информативных образцов из необученного корпуса использовались различные acquisition functions (например, Entropy Sampling и Mean STD Sampling). Экспериментальное исследование проводилось на 2319 CXRs от 963 пациентов с COVID-19, подвергшимися классификации по тяжести заболевания (нормальное состояние, умеренная и серьезная тяжесть). #### Результаты С помощью Entropy Sampling, модель с BNN и весовой функцией потерь показала 93.7% точности в бинарной классификации (нормальное состояние vs. заболевание), используя всего 15.4% от общего количества данных. В многоклассовой классификации (три класса тяжести), Mean STD Sampling достигла 70.3% точности, используя лишь 23.1% меток. Эти результаты были более эффективными по сравнению с более сложными и вычислительно трудозатратными методами, такими как BALD (Batch-Active Learning by Diverse Gradient Estimation). Был также отмечен значительный экономия во времени обучения и выборки, что открывает возможность применения этого подхода в реальном времени. #### Значимость Результаты исследования демонстрируют, что ДАЛ с BNN и весовой функцией потерь может эффективно использоваться для классификации тяжести легочных заболеваний, даже при несбалансированных классах. Это позволяет снизить требования к количеству меток, необходимых для обучения моделей, и улучшить скорость реагирования в критических ситуациях, таких как лечение COVID-19. Модель может

Annotation:

To reduce the amount of required labeled data for lung disease severity classification from chest X-rays (CXRs) under class imbalance, this study applied deep active learning with a Bayesian Neural Network (BNN) approximation and weighted loss function. This retrospective study collected 2,319 CXRs from 963 patients (mean age, 59.2 $\pm$ 16.6 years; 481 female) at Emory Healthcare affiliated hospitals between January and November 2020. All patients had clinically confirmed COVID-19. Each CXR was...

ID: 2508.21263v1 eess.IV, cs.AI, cs.LG

arXiv PDF

📄 HOTSPOT-YOLO: A Lightweight Deep Learning Attention-Driven Model for Detecting Thermal Anomalies in Drone-Based Solar Photovoltaic Inspections

2025-08-28

Авторы:

Mahmoud Dhimish

#### Контекст Тепловые аномалии в солнечных панелях, такие как горячие точки (hotspots), являются критически важной проблемой в операционном эксплуатации солнечных энергетических систем. Они могут привести к снижению эффективности системы, повышению энергозатрат и увеличению технических расходов на ремонт. Для обеспечения надежности и эффективности таких систем необходимо развитие систем автоматической детектирования таких аномалий. Существующие методы часто страдают от низкой точности детекции, высокой вычислительной нагрузки и ограниченной устойчивости в различных условиях окружающей среды. Это показывает необходимость разработки более эффективных и надежных моделей для детекции горячих точек. #### Метод Модель HOTSPOT-YOLO основывается на свёрточных нейронных сетях (Convolutional Neural Networks, CNN) с внедрением механизмов внимания (attention mechanisms). Бэкбон модели — EfficientNet, известный своей эффективностью и низкой вычислительной нагрузкой. Используемый альтернативный видеокодек (AVC) вместе с аттенционным модулем позволяет фокусироваться на ключевых областях изображения, улучшая точность детекции. Модель обучена на обширном наборе данных, включающем различные изображения с горячими точками и нормальными панелями. Для оптимизации работы в реальном времени, алгоритм был оптимизирован с использованием декомпрессии изображений в реальном времени и уменьшения размера рабочего пространства. #### Результаты Опытные исследования проводились на наборе данных, содержащем тысячи изображений с горячими точками и нормальными модулями. Модель HOTSPOT-YOLO достигла максимальной точности детекции средней среди всех сравниваемых моделей, при этом обеспечивая высокую скорость работы. В результате, HOTSPOT-YOLO показала максимальную значимость в области краткосрочного мониторинга и детектирования горячих точек. Эксперименты показали, что модель обладает высокой точностью (90,8%) и низким вычислительным временем, что делает её пригодной для использования в реальных условиях. #### Значимость Модель HOTSPOT-YOLO идеально подходит для широкого спектра задач, включая видеомониторинг и анализ видеопотоков, а также распознавание изображений в среде с многочисленными деталями. Она имеет преимущество перед существующими моделями, такими как YOLOv8 или Tiny-YOLOv5, благодаря улучшенной точности и уменьшенной нагрузке на процессор. Эта модель может быть применена в различных сферах, таких как распознавание тепловых аномалий в других системах, автоматическое мониторинг в индустрии и автоматизированные дорожные инспекции. #### Выводы Результаты показывают,

Annotation:

Thermal anomaly detection in solar photovoltaic (PV) systems is essential for ensuring operational efficiency and reducing maintenance costs. In this study, we developed and named HOTSPOT-YOLO, a lightweight artificial intelligence (AI) model that integrates an efficient convolutional neural network backbone and attention mechanisms to improve object detection. This model is specifically designed for drone-based thermal inspections of PV systems, addressing the unique challenges of detecting sma...

ID: 2508.18912v1 eess.IV, cs.AI, cs.LG

arXiv PDF

📄 Beyond Imaging: Vision Transformer Digital Twin Surrogates for 3D+T Biological Tissue Dynamics

2025-08-25

Авторы:

Kaan Berke Ugurlar, Joaquín de Navascués, Michael Taynnan Barros

#### Контекст Область исследований, ориентированная на понимание динамики организации и гомеостаза живых тканей, требует высококачественных временных серий изображений, а также методов, позволяющих извлекать интерпретируемые и прогностические аналитические выводы из сложных данных. Несмотря на развитие методов изображения, включая многослойные сети и формализмы нейровизуализации, существует недостаток в систематических подходах к моделированию и визуализации тканевых динамик. Этот недостаток ограничивает возможности выполнения виртуальных экспериментов в биологических исследованиях. Мотивация заключается в разработке новых методик, которые могут обеспечить высокоточные, временно резолюционные модели для томографических изображений в реальном времени, позволяющих интеллектуального анализа и моделирования тканевых процессов. #### Метод Предложенный подход, названный Vision Transformer Digital Twin Surrogate Network (VT-DTSN), является глубоким обучением, основанным на трансформерах с в site pretraining, использующим DINO (Self-Distillation with NO Labels). Модель принимает в качестве входных данных последовательные сечения ткани живого организма, полученные с помощью временных серий томографических изображений, и предсказывает их временную динамику в 3D+T пространстве. Архитектура VT-DTSN включает несколько ключевых модулей: Vision Transformer для локального представления входных изображений, Multi-view Fusion Block для объединения многопрослойных сечений и Feature Alignment Module для сохранения биологической правдоподобности выходных данных. Для обучения используется составной функционал ошибки, который оптимизирует пиксельную точность, разрешение структуры и согласование в функциональных пространствах. Такой подход обеспечивает высокую точность моделирования и эффективность вычислений. #### Результаты В экспериментах были использованы временные серии изображений Drosophila midgut, полученные с помощью томографических изображений в реальном времени. VT-DTSN был обучен на данных с высоким разрешением и проверен на независимых наборах данных. Результаты показывают, что модель достигает очень высокой точности в описании динамики тканей, с минимальным погрешностным расхождением и высокой детализацией биологических структур. Было проанализировано влияние различных модулей модели, включая Multi-view Fusion и Feature Alignment, на качество результатов. Было показано, что VT-DTSN позволяет эффективно моделировать тканевые процессы в реальном времени, обеспечивая возможность виртуальных экспериментов и теоретических исследований. #### Значимость Разработанная модель открывает новые возможности в моделировании тканевых процессов в биологии. Ее применение может быть распространено

Annotation:

Understanding the dynamic organization and homeostasis of living tissues requires high-resolution, time-resolved imaging coupled with methods capable of extracting interpretable, predictive insights from complex datasets. Here, we present the Vision Transformer Digital Twin Surrogate Network (VT-DTSN), a deep learning framework for predictive modeling of 3D+T imaging data from biological tissue. By leveraging Vision Transformers pretrained with DINO (Self-Distillation with NO Labels) and employi...

ID: 2508.15883v1 eess.IV, cs.AI, cs.LG, q-bio.TO

arXiv PDF

📄 A Comprehensive Framework for Uncertainty Quantification of Voxel-wise Supervised Models in IVIM MRI

2025-08-09

Авторы:

Nicola Casali, Alessandro Brusaferri, Giuseppe Baselli, Stefano Fumagalli, Edoardo Micotti, Gianluigi Forloni, Riaz Hussein, Giovanna Rizzo, Alfonso Mastropietro

## КОНТЕКСТ И ПРОБЛЕМАТИКА Оценка параметров intravoxel incoherent motion (IVIM) из диффузионно-взвешенной МРТ (DW-MRI) представляет собой сложную задачу, затрудненную некорректностью обратной задачи и высокой чувствительностью к шумам, особенно в перфузионном компоненте. Данная область исследования имеет большое значение, поскольку IVIM-параметры играют ключевую роль в оценке микроциркуляции крови и диффузии в тканях. Однако существующие методы характеризуются значительными недостатками, включая недостаточную точность и неустойчивость оценок в условиях реальных клинических данных. Одним из основных вызовов является необходимость учета неопределенности в оценках параметров, включая как алёаторическую (AU), связанную с шумами в данных, так и эпистемическую (EU), вызванную недостаточностью модели или несоответствием между тренировочными и реальными данными. Традиционные непробебилистические нейросетевые модели, а также байесовские подходы, не всегда обеспечивают достаточную точность и калибровку оценок неопределенности. В связи с этим, авторы статьи предлагают новый пробебилистический подход на основе Deep Ensembles (DE) и Mixture Density Networks (MDNs) для комплексной оценки неопределенности в моделях, основанных на DW-MRI. Данный подход направлен на решение проблемы недостоверных оценок и повышения надежности моделей путем декомпозиции неопределенности на её составляющие. ## ПРЕДЛОЖЕННЫЙ МЕТОД Предложенная модель основывается на комбинации Deep Ensembles (DE) и Mixture Density Networks (MDNs), что позволяет достичь комплексной оценки неопределенности. MDNs используются для моделирования плотности вероятностей выходных параметров, включая диффузионный коэффициент $D$, фракцию $f$ и псевдодиффузионный коэффициент $D*$. DE обеспечивает разнообразие предсказаний за счет обучения нескольких нейросетей с различными инициализациями, что позволяет лучше охватить пространство возможных решений и оценить эпистемическую неопределенность. Процесс обучения проводится на синтезированных данных, сгенерированных на основе физиологически допустимых диапазонов параметров. В процессе обучения учитывается специфика DW-MRI, включая влияние шума и нелинейностей в процессе обработки данных. Для оценки качества модели используются метрики, такие как калибровочные кривые, результаты Continuous Ranked Probability Score (CRPS) и другие индикаторы точности и калибровки. Предложенный метод также включает в себя модуль декомпозиции неопределенности, позволяющий разделить её на алёаторическую и эпистемическую составляющие. Это позволяет идентифицировать недостоверные оценки, вызванные либо шумами в данных, либо несоответствием модели реальным условиям. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Эксперименты проводились как на синтезированных, так и на реальных in vivo данных. Результаты показывают, что MDNs обеспечивают более калиброванные и острые предсказательные распределения для параметров $D$ и $f$, хотя для $D*$ наблюдается небольшое преуверешенное (overconfident) поведение. Использование CRPS показало, что MDNs обеспечивают более гладкие оценки для $D*$ по сравнению с традиционным гауссовским моделированием. Было также продемонстрировано, что EU имеет высокое значение в реальных in vivo условиях, что свидетельствует о несоответствии между тренировочными данными и реальными условиями сканирования. Это подчеркивает важность учета EU в процессе моделирования, что было успешно реализовано в предложенной рамке. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод имеет широкое применение в клинической практике и научных исследованиях, где точная оценка IVIM-параметров крайне важна. Он позволяет не только повысить точность оценок, но и идентифицировать недостоверные результаты, что может предотвратить ошибочные клинические решения. Кроме того, данный подход может быть адаптирован для моделирования других физических процессов за счет соответствующих модификаций архитектуры и симуляционных данных. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В данной работе представлен комплексный подход к оценке неопределенности в моделях IVIM-MRI, который обеспечивает точные и калиброванные предсказания. Будущие исследования могут фокусироваться на дальнейшей оптимизации модели, включая расширение диапазона тренировочных данных и улучшение модуля декомпозиции неопределенности. Также предлагается исследовать возможности применения этого подхода в других областях медицинского изображений.

Annotation:

Accurate estimation of intravoxel incoherent motion (IVIM) parameters from diffusion-weighted MRI remains challenging due to the ill-posed nature of the inverse problem and high sensitivity to noise, particularly in the perfusion compartment. In this work, we propose a probabilistic deep learning framework based on Deep Ensembles (DE) of Mixture Density Networks (MDNs), enabling estimation of total predictive uncertainty and decomposition into aleatoric (AU) and epistemic (EU) components. The me...

ID: 2508.04588v2 eess.IV, cs.AI, cs.LG

arXiv PDF

Показано 1 - 10 из 11 записей