📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Lung Cancer Classification from CT Images Using ResNet

2025-10-22

Авторы:

Olajumoke O. Adekunle, Joseph D. Akinyemi, Khadijat T. Ladoja, Olufade F. W. Onifade

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Lung cancer, a malignancy originating in lung tissues, is commonly diagnosed and classified using medical imaging techniques, particularly computed tomography (CT). Despite the integration of machine learning and deep learning methods, the predictive efficacy of automated systems for lung cancer classification from CT images remains below the desired threshold for clinical adoption. Existing research predominantly focuses on binary classification, distinguishing between malignant and benign lung...

ID: 2510.16310v1 eess.IV, cs.AI, cs.CV, cs.LG, I.4.0; I.4.9

arXiv PDF

📄 VT-FSL: Bridging Vision and Text with LLMs for Few-Shot Learning

2025-10-01

Авторы:

Wenhao Li, Qiangchang Wang, Xianjing Meng, Zhibin Wu, Yilong Yin

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Few-shot learning (FSL) aims to recognize novel concepts from only a few labeled support samples. Recent studies enhance support features by incorporating additional semantic information or designing complex semantic fusion modules. However, they still suffer from hallucinating semantics that contradict the visual evidence due to the lack of grounding in actual instances, resulting in noisy guidance and costly corrections. To address these issues, we propose a novel framework, bridging Vision an...

ID: 2509.25033v1 cs.CV, cs.LG, I.4.9

arXiv PDF

📄 Automated Labeling of Intracranial Arteries with Uncertainty Quantification Using Deep Learning

2025-09-24

Авторы:

Javier Bisbal, Patrick Winter, Sebastian Jofre, Aaron Ponce, Sameer A. Ansari, Ramez Abdalla, Michael Markl, Oliver Welin Odeback, Sergio Uribe, Cristian Tejos, Julio Sotelo, Susanne Schnell, David Marlevi

#### Контекст Анатомическая меткинга интракраниальных артерий является важной задачей в рамках разработки методов диагностики, мониторинга и терапии кардиоваскулярных заболеваний. Однако данная задача требует значительных временных затрат и подвержена значительной интерпертаторной вариативности. Недостаток универсальных автоматизированных систем, обеспечивающих высокую точность и надежность меткинга, ставит под угрозу качество полученных результатов. Данные проблемы мотивируют развитие новых методов, которые были бы широко применимы в клинической практике. #### Метод Для решения данной задачи предложена автоматизированная система, основанная на нейронных сетях. Методология включает три основных компонента: (1) сверточные нейронные сети (UNet) с резидентными блоками, (2) CS-Net с аугментацией канала и пространственной атенции для повышения чувствительности к кривизненным структурам, и (3) nnUNet, адаптивная система, которая автоматизирует обработку данных и архитектуру сети на основе характеристик данных. Для оценки точности работы системы использовались метрики Dice и surface distance. Для оценки неуверенности в системе внедрена тест-тайм аугментация (TTA) и разработана новая методика, снижающая ошибки интерполяции. #### Результаты Исследование проводилось на 35 сегментированных трехмерных томограммах 3D Time-of-Flight Magnetic Resonance Angiography (3D ToF-MRA). Архитектура nnUNet показала наилучшие результаты среди всех исследуемых моделей, с Dice-score в 0.922 и average surface distance в 0.387 мм. Был продемонстрирован улучшенный показатель точности в анатомически сложной вариативной среде. Оценка неуверенности в результатах проводилась с помощью TTA, которая показала способность системы определять области амбигуности, патологических изменений и несоответствий в ручных метках. Кроме того, система была проверена на валидационных данных 4D Flow MRI, показав близкий соответствие с ручными метками в расчетах потока крови. #### Значимость Предложенная система представляет собой простой и эффективный инструмент для автоматического меткинга интракраниальных артерий, который может существенно снизить время на ручную работу врачей. Данная технология может быть использована в различных областях, включая диагностику заболеваний, планирование хирургических вмешательств и мониторинг состояния здоровья. Основное преимущество системы заключается в ее надежности и возможности оценивать неуверенность в результатах, обеспечивая более точную клиническую интеграцию. #### Выводы Разработанная система демонстрирует высокую точность и надежность в автоматичес

Annotation:

Accurate anatomical labeling of intracranial arteries is essential for cerebrovascular diagnosis and hemodynamic analysis but remains time-consuming and subject to interoperator variability. We present a deep learning-based framework for automated artery labeling from 3D Time-of-Flight Magnetic Resonance Angiography (3D ToF-MRA) segmentations (n=35), incorporating uncertainty quantification to enhance interpretability and reliability. We evaluated three convolutional neural network architectures...

ID: 2509.17726v1 cs.CV, cs.LG, I.4.0

arXiv PDF

📄 SynGen-Vision: Synthetic Data Generation for training industrial vision models

2025-09-09

Авторы:

Alpana Dubey, Suma Mani Kuriakose, Nitish Bhardwaj

## Контекст Область исследования — синтетическое генерирование данных для обучения моделей компьютерного зрения (CV), специфичных для промышленных задач. Одна из таких задач — обнаружение износа и повреждений при помощи CV-моделей, которая критична для проведения прогностического обслуживания в различных отраслях. Однако данные для обучения таких моделей являются дорогостоящими и сложны в подготовке из-за нехватки широкой выборки изображений, охватывающих различные сценарии износа и повреждений. Готовые данные для этих задач нередко отсутствуют, что приводит к затрудненному обучению моделей и ограниченной их общедоступной эффективности. Мотивация заключается в создании метода, который позволит генерировать синтетические данные для обучения моделей обнаружения износа и повреждений, оптимально адаптированных для промышленных сценариев. ## Метод Проposed approach включает в себя использование vision language model (VLM) в сочетании с 3D-симулятором и рендеринговым движком для генерирования синтетических данных. Модель VLM используется для генерирования текстовых описаний износа и повреждений, которые затем передаются в 3D-симулятор для создания реалистичных синтетических изображений. Модель рендеринга создает изображения с различными уровнями износа (например, различные стадии ржавчины), которые затем могут использоваться для обучения CV-моделей. Эта процедура позволяет создавать пользовательскими настройками синтетические данные, учитывающие различные промышленные сценарии. Техническая архитектура включает в себя несколько модулей: VLM для понимания текстовых описаний, 3D-симулятор для моделирования износа и повреждений, и рендеринговый движок для генерации изображений. ## Результаты Для оценки эффективности approach была проведена серия экспериментов. Была создана выборка синтетических данных с различными уровнями ржавчины, используя VLM и 3D-симулятор. Эти данные были использованы для обучения модели CV, нацеленной на обнаружение ржавчины. Оценка производительности производилась с помощью метрики mAP50 (mean Average Precision with IoU 50%) на реальных изображениях промышленных объектов, покрытых ржавчиной. Результаты показали, что модель, обученная синтетическими данными, достигла максимального mAP50 0.87, что превышает результаты других подходов. Это свидетельствует о том, что синтетические данные, генерируемые нашей системой, не только выполняются эффективно на реальных задачах, но и превосходят другие методы по обучению моделей компьютерного зрения для такого класса задач. ## Значимость Проposed approach имеет значительное значение для индустрии, так как он может

Annotation:

We propose an approach to generate synthetic data to train computer vision (CV) models for industrial wear and tear detection. Wear and tear detection is an important CV problem for predictive maintenance tasks in any industry. However, data curation for training such models is expensive and time-consuming due to the unavailability of datasets for different wear and tear scenarios. Our approach employs a vision language model along with a 3D simulation and rendering engine to generate synthetic ...

ID: 2509.04894v1 cs.CV, cs.LG, I.4

arXiv PDF

📄 Automatic and standardized surgical reporting for central nervous system tumors

2025-08-14

Авторы:

David Bouget, Mathilde Gajda Faanes, Asgeir Store Jakola, Frederik Barkhof, Hilko Ardon, Lorenzo Bello, Mitchel S. Berger, Shawn L. Hervey-Jumper, Julia Furtner, Albert J. S. Idema, Barbara Kiesel, Georg Widhalm, Rishi Nandoe Tewarie, Emmanuel Mandonnet, Pierre A. Robe, Michiel Wagemakers, Timothy R. Smith, Philip C. De Witt Hamer, Ole solheim, Ingerid Reinertsen

## Контекст Оценка центральной нервной системы (CNS) и CNS-туморов является ключевым аспектом в медицинской практике. Магнитная резонансная (МР) импедимометрия является неотъемлемой частью этой процедуры, поскольку она помогает в планировании операций, принимать решения о лечении и оценивать послеоперационные результаты и риски осложнений. Несмотря на прогресс в автоматическом разметке и анализе предоберательных данных, автоматизация анализа послеоперационных данных остается сложной задачей. Существующие методы недостаточно удобны и эффективны для постоперационного анализа. Это влечет за собой необходимость в разработке более продвинутых методов, которые могут значительно повысить точность и эффективность постоперационных оценок. ## Метод Для решения этой задачи была разработана инновационная пипелайнная система, включающая модели сегментации и классификации, а также алгоритмы, поддерживающие стандартизацию отчетов. Модели сегментации основываются на архитектуре Attention U-Net, а модели классификации — на DenseNet. Эти модели были обучены на больших многоцентровых данных (2000–7000 пациентов) с использованием 5-кросс-валидации. Метрики оценки включали в себя voxel-wise и object-wise оценки. Для классификации секвенций МР и типа турмов была разработана DenseNet-подобная архитектура, поддерживающая стандартизацию отчетов в соответствии с RANO 2.0. Эта система затем была внедрена в Raidionics — открытую платформу для анализа CNS-турмов. ## Результаты Модели сегментации достигли следующих результатов: voxel-wise Dice-score 87% для неотгрустнованного турмового ядра, 66% для неотгрустнованного турмового ядра, 70% для поперечной секции турмового ядра, 77% для отделания. Классификационные модели показали балансную точность 99,5% для классификации секвенций МР и 80% для классификации типов турмов. Эти результаты превосходят показатели последнего BraTS-чалленга, устанавливая новый стандарт в сфере автоматизированного анализа CNS-турмов. ## Значимость Предлагаемая система имеет широкие возможности применения в клинической практике. Она обеспечивает точные, стандартизированные отчеты, повышает эффективность оперативного управления и помогает лучше оценивать риски осложнений. Эта инновационная технология может существенно снизить нагрузку на клинических специалистов, увеличить точность диагноза и лечения, а также повысить качество постоперационного мониторинга. ## Выводы Разработанная система представляет собой значительный прорыв в области автома

Annotation:

Magnetic resonance (MR) imaging is essential for evaluating central nervous system (CNS) tumors, guiding surgical planning, treatment decisions, and assessing postoperative outcomes and complication risks. While recent work has advanced automated tumor segmentation and report generation, most efforts have focused on preoperative data, with limited attention to postoperative imaging analysis. This study introduces a comprehensive pipeline for standardized postsurtical reporting in CNS tumors. Usi...

ID: 2508.08916v1 cs.CV, cs.LG, I.4.6; J.3

arXiv PDF