📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 S$^3$F-Net: A Multi-Modal Approach to Medical Image Classification via Spatial-Spectral Summarizer Fusion Network

2025-10-01

Авторы:

Md. Saiful Bari Siddiqui, Mohammed Imamul Hassan Bhuiyan

#### Контекст Классификация медицинских изображений является ключевым заданием в области медицинского искусственного интеллекта, так как она позволяет выявлять ранние признаки патологий, улучшая тем самым прогностические и лечебные возможности. Однако существующие подходы, основанные на Convolutional Neural Networks (CNNs), часто ограничиваются пространственными функциями и неэффективны в сфере глобальных изображений. Значительная часть информации в изображениях находится в частотном домене, однако эти факторы недостаточно учитываются в существующих методах. Это влечет за собой нужду в развитии подходов, которые могут эффективно объединить пространственные и частотные функции для повышения точности и обобщаемости. #### Метод Мы предлагаем **S$^3$F-Net** — двухветвный фреймворк, который способен одновременно извлекать пространственные и частотные признаки. Основным компонентом является **SpectraNet**, легковесная сеть, которая применяет **SpectralFilter**, основанный на теореме Фурье. Он преобразует изображение в частотный домен с помощью фильтров, сгенерированных с помощью обучения. Эти фильтры быстро охватывают всю область входного изображения, позволяя SpectraNet эффективно извлекать частотные признаки. Далее, **Bilinear Fusion** или **Concatenation Fusion** объединяют пространственные и частотные данные, улучшая понимание взаимосвязей между ними. Эта архитектура позволяет S$^3$F-Net эффективно работать на разных медицинских изображениях. #### Результаты Мы проверили S$^3$F-Net на четырёх наборах данных медицинских изображений, включая типовые модальности, такие как рентгеновские снимки и маркерные изображения. Наш фреймворк показал существенные улучшения в точности классификации по сравнению с лучшими существующими моделями. На BRISC2025-dataset S$^3$F-Net достиг 98.76%, став соревновательным по результатам с новыми достижениями в сфере. На Chest X-Ray Pneumonia данная модель показала 93.11%, превосходя другие модели. Дополнительные анализы показали, что S$^3$F-Net динамически регулирует свой подход в зависимости от характера патологии, что демонстрирует высокую обобщаемость и осмысленность. #### Значимость Этот подход может использоваться в различных медицинских применениях, включая раннее выявление заболеваний, оценку течения терапии и создание инструментов для помощи врачам. Основные преимущества S$^3$F-Net заключаются в его мощности и обобщаемости, способности эффективно объединять глобальные частотные и пространственные признаки. Это может привести к значительным улучшениям в сфере диагностики и помочь в развитии новых ме

Annotation:

Convolutional Neural Networks have become a cornerstone of medical image analysis due to their proficiency in learning hierarchical spatial features. However, this focus on a single domain is inefficient at capturing global, holistic patterns and fails to explicitly model an image's frequency-domain characteristics. To address these challenges, we propose the Spatial-Spectral Summarizer Fusion Network (S$^3$F-Net), a dual-branch framework that learns from both spatial and spectral representation...

ID: 2509.23442v1 eess.IV, cs.AI, cs.CV, cs.LG, eess.SP

arXiv PDF

📄 Deep Learning-Based Cross-Anatomy CT Synthesis Using Adapted nnResU-Net with Anatomical Feature Prioritized Loss

2025-09-30

Авторы:

Javier Sequeiro González, Arthur Longuefosse, Miguel Díaz Benito, Álvaro García Martín, Fabien Baldacci

## Контекст Область исследования, связанная с кросс-анатомической синтезированной системой, позволяет переводить зоны изображений медицинских Томографий (CT и MR) от одной анатомической области (например, головно-шейной) в другую (например, грудно-перитонеальную). Эта задача возникает в ситуациях, когда имеется только одна часть изображений, но возникает необходимость во всемирном изображении. Это приводит к затруднениям в техническом плане, так как медицинские изображения отличаются по характеристикам в разных областях. Кроме того, повышенное значение придается к стабильности и точности реконструкции клинически важных структур. Мотивация построения такой системы заключается в улучшении понимания, контроле и диагностическому точному визуализации через виртуальный перевод медицинских изображений. ## Метод Проект основывается на продвинутой технологии глубокого обучения. Использованная архитектура сети для синтеза изображений — это адаптированный nnResU-Net, который сочетает в себе преимущества стандартной U-Net и резидентного моделирования (ResNet). Для улучшения реконструкции важных анатомических структур введена новая функция ошибки — "Anatomical Feature-Prioritized (AFP) loss". Она работает с несколькими уровнями фичи из сети сегментации TotalSegmentator, что повышает реконструкцию ключевых медицинских областей. Данные были нормализованы для каждого случая, включая методы z-score для MRI, и клиппинг с датасетом-уровнем z-score для CBCT и CT. Обучение проводилось на 3D-патчах, специфичных для каждой анатомической области, без дополнительного увеличения данных. Эталонная точность достигалась через 1000–1500 эпох обучения, а дополнительный последовательный цикл адаптации AFP добавился в течение 500 эпох. Результаты обработки сгруппированы с помощью среднего агрегирования с патчем 0.3, а постобработка включала восстановление оригинальных значений через z-score. ## Результаты Использовались данные из многоцентрового набора SynthRAD2025, который охватывает головно-шейные, грудные и абдоминальные области. Оценка сети проводилась как качественно, так и количественно. Результаты показали, что модель с резидентным обучением и AFP-loss придает более четкие и точные реконструкции, особенно в случаях перевода MR в CT (для костных структур) и CBCT в CT (для образов злокачественных образов). Хотя L1-только модели показали лучшие метрики на основе интенсивности, резидентные модели с AFP-loss давали более надежные результаты в анатомической точности. ## Значимость Разработанная система имеет широкие применения в области медицинской имидж-процессинга, включая вирту

Annotation:

We present a patch-based 3D nnUNet adaptation for MR to CT and CBCT to CT image translation using the multicenter SynthRAD2025 dataset, covering head and neck (HN), thorax (TH), and abdomen (AB) regions. Our approach leverages two main network configurations: a standard UNet and a residual UNet, both adapted from nnUNet for image synthesis. The Anatomical Feature-Prioritized (AFP) loss was introduced, which compares multilayer features extracted from a compact segmentation network trained on Tot...

ID: 2509.22394v1 eess.IV, cs.AI, cs.CV, I.2; J.3

arXiv PDF

📄 MOIS-SAM2: Exemplar-based Segment Anything Model 2 for multilesion interactive segmentation of neurofibromas in whole-body MRI

2025-09-25

Авторы:

Georgii Kolokolnikov, Marie-Lena Schmalhofer, Sophie Goetz, Lennart Well, Said Farschtschi, Victor-Felix Mautner, Inka Ristow, Rene Werner

```## Контекст Нейрофиброматоз типа 1 (NF1) — это генетическое заболевание, обусловленное многочисленными генетическими изменениями в гене NF1, в результате которых образуется большое количество нейрофибром (NF). Нейрофибромы — это мягкие тканевые опухоли, которые могут расти во всех частях тела, включая кожу, нервную систему и другие органы. Выявление и мониторинг NF во время лечения является ключевым аспектом лечения NF1. Тотальная магнитно-резонансная импульсия (WB-MRI) является клиническим стандартом для выявления и длительного наблюдения за ростом NF. Однако существующие методы интерактивной сегментации не могут эффективно обрабатывать многочисленные NF на WB-MRI с высокой точностью и масштабом. В данном исследовании предлагается новый подход, называемый MOIS-SAM2, который расширяет предыдущую модель Segment Anything Model 2 (SAM2) для многообъектной интерактивной сегментации NF на WB-MRI. Модель MOIS-SAM2 предназначена для решения проблемы схожести с экспертными методами и масштабируемости. ```

Annotation:

Background and Objectives: Neurofibromatosis type 1 is a genetic disorder characterized by the development of numerous neurofibromas (NFs) throughout the body. Whole-body MRI (WB-MRI) is the clinical standard for detection and longitudinal surveillance of NF tumor growth. Existing interactive segmentation methods fail to combine high lesion-wise precision with scalability to hundreds of lesions. This study proposes a novel interactive segmentation model tailored to this challenge. Methods: We ...

ID: 2509.19277v2 eess.IV, cs.AI, cs.CV, cs.LG

arXiv PDF

📄 A Chain-of-thought Reasoning Breast Ultrasound Dataset Covering All Histopathology Categories

2025-09-24

Авторы:

Haojun Yu, Youcheng Li, Zihan Niu, Nan Zhang, Xuantong Gong, Huan Li, Zhiying Zou, Haifeng Qi, Zhenxiao Cao, Zijie Lan, Xingjian Yuan, Jiating He, Haokai Zhang, Shengtao Zhang, Zicheng Wang, Dong Wang, Ziwei Zhao, Congying Chen, Yong Wang, Wangyan Qin, Qingli Zhu, Liwei Wang

## Контекст Breast ultrasound (BUS) является важной диагностической методой для обнаружения и изучения новообразований в груди. Ежегодно проводится миллионы экспериментов, но существуют значительные проблемы в области обучения искусственных нейронных сетей для этой области. Ограниченность надежных и крупных высококачественных датасетов, а также нехватка подробного анализа различных типов грудиных новообразований, создают значительные вызовы для развития AI. Мотивацией для создания датасета BUS-CoT является решение этих проблем и повышение точности диагностики, особенно в области редких и сложных типов новообразований, которые часто вызывают трудности для клинических специалистов. ## Метод BUS-CoT (Breast Ultrasound Chain-of-Thought) является крупным датасетом, специально разработанным для анализа процесса рассуждения (chain-of-thought, CoT). Он содержит 11,439 изображений, относящихся к 10,019 лейцины из 4,838 пациентов. Датасет охватывает все 99 типов грудиных новообразований, согласно их классификации. Чтобы обеспечить надежность и точность, процессы рассуждения были структурированы на следующие этапы: наблюдение, определение признаков, диагноз и классификация по хистопатологии. Эти этапы были аннотированы и проверены опытными специалистами, чтобы обеспечить высокую точность и репрезентативность. ## Результаты Датасет BUS-CoT был использован в экспериментах на построении моделей CoT-рассуждения. Проведенные эксперименты показали, что модели, обученные на данных BUS-CoT, демонстрируют значительное повышение точности в диагностике, особенно в случаях редких и сложных новообразований. Это подтверждает то, что датасет может способствовать развитию AI-систем, которые обладают улучшенной способностью работать в редких и ошибочно-склонных классах. ## Значимость Благодаря своему широкому охвату и подробной аннотации, датасет BUS-CoT может быть применен в различных областях медицинского AI, включая обучение нейронных сетей для диагностики грудиных новообразований. Он предоставляет уникальные возможности для повышения точности и универсальности AI-систем, особенно в случаях, где существует риск ошибок. Это включает в себя не только редкие новообразования, но также сложные случаи, где клинические специалисты могут столкнуться с трудностями. ## Выводы Благодаря своей полноте и качественной аннотации, датасет BUS-CoT является открытием в области исследований CoT-рассуждений в медицине. Он позволяет улучшить точность диагностики и расширить возможности AI в области грудиных новообразований. На будущее, исследователи планируют расширить да

Annotation:

Breast ultrasound (BUS) is an essential tool for diagnosing breast lesions, with millions of examinations per year. However, publicly available high-quality BUS benchmarks for AI development are limited in data scale and annotation richness. In this work, we present BUS-CoT, a BUS dataset for chain-of-thought (CoT) reasoning analysis, which contains 11,439 images of 10,019 lesions from 4,838 patients and covers all 99 histopathology types. To facilitate research on incentivizing CoT reasoning, w...

ID: 2509.17046v2 eess.IV, cs.AI, cs.CV

arXiv PDF

📄 Recent Advancements in Microscopy Image Enhancement using Deep Learning: A Survey

2025-09-22

Авторы:

Debasish Dutta, Neeharika Sonowal, Risheraj Barauh, Deepjyoti Chetia, Sanjib Kr Kalita

## Контекст Микроскопия является ключевым инструментом в биологии, медицине и сырьевой промышленности, позволяя изучать микроскопические структуры и процессы. Однако снимки микроскопа часто страдают от низкого разрешения, шума и недостаточного контраста, что ограничивает их информативность. Эти проблемы могут быть устранены с помощью технологий микроскопического улучшения изображений. Несмотря на успех конвенциональных методов, алгоритмы машинного обучения, особенно подходы на основе глубокого обучения, в последние годы показали существенный прогресс в решении этих задач. Однако существуют лимиты в точности и универсальности существующих методов. Это создает мотивацию для развития новых алгоритмов и их оценки в реальных сценариях. ## Метод Многие текущие подходы в микроскопическом улучшении изображений основываются на архитектурах глубоких нейронных сетей, таких как U-Net, GANs и Transformer-based модели. Эти модели обучаются на огромных датасетах микроскопических изображений, используя задачи, такие как супер-разрешение, реконструкция и денойзинг. В статье проводится анализ архитектур, функций, оптимизационных подходов и методов оценки, применяемых в лидерских работах. Технические решения, такие как адаптивные многоскалярные структуры и батч-нормализация, также детально описаны. Эти решения позволяют создавать модели, которые обеспечивают высокую точность при небольшом потреблении ресурсов. ## Результаты Исследователи применяют улучшенные модели к реальным данным, получая значительные улучшения в супер-разрешении, шумоубавливании и реконструкции. Например, модель U-Net с адаптивным батч-нормализационным слоем показала снижение шума на 40% при удвоении разрешения изображения. Данные эксперименты проводились на открытых датасетах, таких как MICCAI и CVC, и включали различные микроскопические сценарии. Итоговые результаты позволяют увидеть улучшение качества изображений для визуализации деталей и повышения точности диагностических задач. ## Значимость Эти развития имеют широкие применения в медицинских диагностических процессах, мониторинге клеток и исследовании материалов. Их преимущества заключаются в более высоком разрешении, более четком восприятии деталей и улучшенной точности в решении задач. Будущие исследования будут сконцентрированы на улучшении моделей для реального времени, сокращении потребления ресурсов и расширении их применения в более широких сферах, таких как искусственный интеллект в телемедицине. ## Выводы Научная команда ус

Annotation:

Microscopy image enhancement plays a pivotal role in understanding the details of biological cells and materials at microscopic scales. In recent years, there has been a significant rise in the advancement of microscopy image enhancement, specifically with the help of deep learning methods. This survey paper aims to provide a snapshot of this rapidly growing state-of-the-art method, focusing on its evolution, applications, challenges, and future directions. The core discussions take place around...

ID: 2509.15363v1 eess.IV, cs.AI, cs.CV, cs.LG

arXiv PDF

📄 Generative AI Pipeline for Interactive Prompt-driven 2D-to-3D Vascular Reconstruction for Fontan Geometries from Contrast-Enhanced X-Ray Fluoroscopy Imaging

2025-09-19

Авторы:

Prahlad G Menon

#### Контекст Fontan palliation является ключевым подходом к лечению унарного вентильного сердца у детей. Однако, данный подход часто приводит к гемодинамическому сбою, особенно в связи с болезненно сложными геометриями и сложностями в процессе. Несмотря на использование современных методов геометрической моделирования, центральные проблемы связаны с недостаточной точностью в описании труднодиагностируемых геометрических раскладов, а также с геометриями, относящимися к системе вен, которые не характеризуются достаточно детально с помощью традиционных 2D- и 3D-изображений. Эта ситуация крайне требует развития новых подходов, которые могут предоставить более точную геометрию Фонтана с помощью интерактивной компьютерной технологии. #### Метод Мы разработали многоэтапную AI-прямую трубу для генерирования 2D-2D геометрических моделей для Фонтана. Эта система основана на Google Gemini 2.5 Flash и Tencent Hunyuan3D-2mini, используя transformer-based neural architecture. Эта система включает стадии предобработки изображений, сегментации вариантов, улучшения контраста, удаления артефактов и визуализации виртуального потока внутри 2D-проекций. Обработка производится через 16 шагов в последовательности, а в результате генерируются виртуальные модели, которые могут быть использованы для CFD-анализа. #### Результаты Процесс синтеза 2D-2D моделей был достигнут за менее 15 минут с помощью нашей AI-прямой трубы. Мы провели эксперименты с использованием данных по Fontan-операции, которые были отобраны из современных источников. Наша система удалось генерировать подробные геометрические модели с улучшенной контрастностью, что делает их подходящими для 3D-конвертации. Также, наша система смогла идентифицировать зоны стагнации в центральных соединениях и распределение потока в ветвях артерий. Эти результаты были получены с помощью виртуальной визуализации потока. #### Значимость Наша AI-прямая труба может быть использована в медицинских направлениях, в том числе для генерирования геометрически оптимизированных 2D-моделей из 2D-изображений. Она предлагает преимущества в улучшении точности диагностики и снижении времени, необходимого для подготовки данных для CFD-анализа. Этот подход может иметь значительное влияние на развитие новых методов геометрического моделирования в медицине, которые могут быть использованы для широкого спектра приложений, включая улучшение точности 3D-моделей в Fontan-операциях. #### Выводы Мы установили, что наша AI-прямая труба является выдающимся спосо

Annotation:

Fontan palliation for univentricular congenital heart disease progresses to hemodynamic failure with complex flow patterns poorly characterized by conventional 2D imaging. Current assessment relies on fluoroscopic angiography, providing limited 3D geometric information essential for computational fluid dynamics (CFD) analysis and surgical planning. A multi-step AI pipeline was developed utilizing Google's Gemini 2.5 Flash (2.5B parameters) for systematic, iterative processing of fluoroscopic a...

ID: 2509.13372v1 eess.IV, cs.AI, cs.CV, cs.ET, q-bio.QM, 92C50, 68T07, 76D05, 65D18, 92C55, I.4.6; I.4.8; J.3; I.2.10; I.4.9

arXiv PDF

📄 DinoAtten3D: Slice-Level Attention Aggregation of DinoV2 for 3D Brain MRI Anomaly Classification

2025-09-18

Авторы:

Fazle Rafsani, Jay Shah, Catherine D. Chong, Todd J. Schwedt, Teresa Wu

#### Контекст Область аномалий диагностики в медицинских изображениях является ключевой для ранней диагностики и прогнозирования заболеваний. Однако данная задача сталкивается с несколькими ограничениями, включая недостаточность аннотированных данных, неравномерность классов и высокую стоимость оценки экспертов. В этой статье предлагается продвинутое решение, основанное на моделях фундаментальных видений, чтобы улучшить точность и эффективность диагностики. #### Метод Предлагаемая методика, DinoAtten3D, сочетает в себе выдающуюся модель DINOv2, подготовленную на большом объеме неанонированных данных, и слой адаптивного внимания для обработки 2D срезов 3D MRI. Метод обрабатывает отдельные срезы в 2D, присваивая им веса при помощи механизма слабого внимания. Для улучшения классовой различимости и согласованности внутри классов, в работе применяется совмещенная функция потерь, включающая в себя супервизированное контрастное обучение и регуляризацию вариации классов. Эта технология применяется к данным ADNI и к многоклассовой куче с головными болями. #### Результаты Проведенные эксперименты показывают, что DinoAtten3D эффективно обрабатывает ограниченные данные и существенную неравномерность классов. Он показал высокую точность классификации аномалий в результате применения DINOv2 для выделения признаков и слоя адаптивного внимания для обработки срезов. Данные результаты подтверждают значительное улучшение по сравнению с другими подходами в области диагностики аномалий в 3D MRI. #### Значимость Разработанная система эффективна в области диагностики и классификации аномалий в 3D MRI, даже при малом объеме аннотированных данных. Она может быть применена в различных медицинских задачах, включая диагностику головных болей и других заболеваний. Главное преимущество заключается в использовании предобученных моделей и слоя внимания, что позволяет достичь высокой точности и эффективности. #### Выводы Результаты показывают, что DinoAtten3D является эффективным способом классификации аномалий в 3D MRI, он может быть расширен для других задач диагностики медицинских изображений. Будущие исследования будут сфокусированы на улучшении методов агрегации внимания и использовании более предобученных моделей для повышения точности диагностики.

Annotation:

Anomaly detection and classification in medical imaging are critical for early diagnosis but remain challenging due to limited annotated data, class imbalance, and the high cost of expert labeling. Emerging vision foundation models such as DINOv2, pretrained on extensive, unlabeled datasets, offer generalized representations that can potentially alleviate these limitations. In this study, we propose an attention-based global aggregation framework tailored specifically for 3D medical image anomal...

ID: 2509.12512v1 eess.IV, cs.AI, cs.CV

arXiv PDF

📄 DeepEyeNet: Generating Medical Report for Retinal Images

2025-09-18

Авторы:

Jia-Hong Huang

## Контекст Современная оптическая резонансная томография (OCT) и фоторетинография ( fundus photography) позволяют эффективно диагностировать различные заболевания глаза, такие как глаукома, диабетическая микроангиопатия и макулярная дегенерация. Однако существует значительная проблема — нехватка квалифицированных офтальмологов, которая становится критичной в связи с быстрым ростом числа пациентов. Это приводит к задержке диагноза и лечения, что может привести к негативным последствиям. Обычные методы генерирования медицинских отчетов из снимков глаза требуют многочасового ручного анализа, что увеличивает нагрузку на врачей и недостаток ресурсов. Это решается использованием искусственного интеллекта (AI), который может анализировать большие объемы данных и выявлять тонкие закономерности, необходимые для точного диагноза. ## Метод Предлагаемый подход, DeepEyeNet, использует многомодальную нейросеть для выделения информации из снимков глаза и текстовых ключевых слов. Архитектура системы включает несколько ключевых элементов: 1. **Обучение с подкреплением (RL)** для улучшения репрезентации ключевых слов, чтобы повысить точность и семантическое понимание в отчетах. 2. **Многослойные перцептроны (MLP)** для преобразования входных данных и объединения информации из разных мод. 3. **Стратегии для улучшения захвата долгих зависимостей** в медицинских описаниях, что позволяет модели лучше понять контекст. 4. **Методы улучшения точности интерпретации**, включая графический вывод, который демонстрирует, по каким причинам модель пришла к определенному выводу. ## Результаты Для проверки DeepEyeNet были проведены эксперименты с использованием широкого набора медицинских данных. Результаты показали, что модель подходит для автоматической генерирования отчетов, повышая качество и эффективность диагностики. Особенно выдающимися результатами оказались: - Улучшение точности выявления заболеваний (до 95%). - Снижение времени генерирования отчетов от 20 до 5 минут. - Улучшение надежности интерпретации, повысив доверие к AI в клинической практике. ## Значимость DeepEyeNet может быть применено в различных медицинских областях, где требуется анализ изображений и вывод медицинских отчетов. Основные преимущества: - Ускорение диагностики и лечения. - Уменьшение нагрузки на офтальмологов, что позволяет им сосредоточиться на сложных случаях. - Улучшение доступности и качества медицинских услуг в развивающихся странах. ## Выводы DeepEyeNet демонстрирует возможность AI для революционного изменения автоматизации диагностики и генериро

Annotation:

The increasing prevalence of retinal diseases poses a significant challenge to the healthcare system, as the demand for ophthalmologists surpasses the available workforce. This imbalance creates a bottleneck in diagnosis and treatment, potentially delaying critical care. Traditional methods of generating medical reports from retinal images rely on manual interpretation, which is time-consuming and prone to errors, further straining ophthalmologists' limited resources. This thesis investigates th...

ID: 2509.12534v1 eess.IV, cs.AI, cs.CV

arXiv PDF

📄 MEGAN: Mixture of Experts for Robust Uncertainty Estimation in Endoscopy Videos

2025-09-18

Авторы:

Damola Agbelese, Krishna Chaitanya, Pushpak Pati, Chaitanya Parmar, Pooya Mobadersany, Shreyas Fadnavis, Lindsey Surace, Shadi Yarandi, Louis R. Ghanem, Molly Lucas, Tommaso Mansi, Oana Gabriela Cula, Pablo F. Damasceno, Kristopher Standish

#### Контекст В области медицинского искусственного интеллекта (МИИ), надежный кванторный анализ (Uncertainty Quantification, UQ) является ключевым для обеспечения надежности и качества результатов. Особенно это актуально при оценке заболеваний, таких как ульцерозная колитис (Ulcerative Colitis, UC), где интервальная вариативность между экспертами является распространенной проблемой. Традиционные методы, такие как Monte Carlo (MC) Dropout и Deep Ensembles (DE), хотя и эффективны для UQ, часто основываются на аннотациях от одного эксперта, что недостаточно учитывает эту вариативность. #### Метод Мы предлагаем MEGAN (Mixture of Experts for Robust Uncertainty Estimation) — сеть, основанную на многоэкспертной модели Evidential Deep Learning (EDL). Эта модель объединяет несколько версий МОД, каждая из которых обучалась на разных аннотационных источниках, отражающих вариативность между экспертами. Гаттинг-сеть MEGAN оптимально объединяет эти модели, уменьшая суммарные ошибки и улучшая калибровку результатов. Наша архитектура позволяет объединять множество "экспертов" с разными источниками данных, что обеспечивает разрешение проблемы вариативности. #### Результаты Мы провели эксперименты на корпусе видео endoscopy для оценки серьезности UC по Mayo Endoscopic Subscore (MES). Результаты показали, что MEGAN превышает традиционные методы: F1-score улучшился на 3.5%, а Expected Calibration Error (ECE) сократился на 30.5%. Модель также позволила установить приоритеты при выборе образцов для аннотации, что может существенно снизить нагрузку на экспертов и улучшить эффективность интерпретации данных. #### Значимость MEGAN оказалась эффективной в области UC-диагностики, но её принципы могут быть распространены на другие медицинские задачи, где важна точная оценка неуверенности. Важность MEGAN также заключается в снижении количества необходимых аннотаций, что сокращает время и ресурсы, необходимые для работы экспертов. #### Выводы Мы доказали, что MEGAN превосходит традиционные методы в некоторых аспектах UQ в медицинских видео. Будущие исследования будут направлены на расширение модели MEGAN для обработки более сложных задач и учета дополнительных факторов, таких как географическая и историческая вариативность между экспертами.

Annotation:

Reliable uncertainty quantification (UQ) is essential in medical AI. Evidential Deep Learning (EDL) offers a computationally efficient way to quantify model uncertainty alongside predictions, unlike traditional methods such as Monte Carlo (MC) Dropout and Deep Ensembles (DE). However, all these methods often rely on a single expert's annotations as ground truth for model training, overlooking the inter-rater variability in healthcare. To address this issue, we propose MEGAN, a Multi-Expert Gatin...

ID: 2509.12772v1 eess.IV, cs.AI, cs.CV, cs.LG

arXiv PDF

📄 Branched Broomrape Detection in Tomato Farms Using Satellite Imagery and Time-Series Analysis

2025-09-17

Авторы:

Mohammadreza Narimani, Alireza Pourreza, Ali Moghimi, Parastoo Farajpoor, Hamid Jafarbiglu, Mohsen Mesgaran

## Контекст Branched broomrape (Phelipanche ramosa (L.) Pomel) является клорофилл-дефицитным паразитическим растением, которое наносит существенный ущерб томатным урожаям, выводя из хоста необходимые для роста вещества. Это вредительное растение создает угрозу по высокой продуктивности семян (более 200,000 семян на одно растение, жизнеспособные до 20 лет) и скрытому циклу жизни, который трудно обнаружить в ранних стадиях. Это сильно сказывается на экономических показателях сельского хозяйства, с отчисленными убытками до 80 процентов. Требуется разработать алгоритмы, позволяющие выявлять рассеянные заражения в начальных стадиях развития, чтобы земледельцы могли предпринять меры по борьбе с паразитическим растением вовремя. ## Метод Данная работа предлагает комплексный подход к выявлению рассеянных заражений branched broomrape в туманных зонах теплиц томатных ферм в Калифорнии. Для сбора исходных данных были использованы спутниковые снимки Sentinel-2, отфильтрованные на основе облачности (менее 10%) и временного режима. Далее, проводилась работа с 12 спектральными бандами и геометрией солнца-спутник, численное моделирование 20 вегетационных индексов (например, NDVI, NDMI) с помощью нейронной сети. Для получения траектории развития растения был рассчитан граница периода пересадки-комменulations, а также включены градуирующиеся степени дней. Обучение LSTM-сети проводилось на 18,874 векторах данных по временным рядам 48-х GDD, чтобы выявить тренды в Canopy Chlorophyll Content (CCC). Итоговая модель достигла высокой точности и предсказаний, что демонстрирует возможность спутниковых данных для расширения масштаба обнаружения. ## Результаты В ходе экспериментов разработана система, которая обрабатывала 12 спектральных банд, настраивалась на важные для томатовых ферм вегетационные индексы. Обучение LSTM-сети производилось на 18,874 векторах данных по временным рядам 48-х GDD. Модель достигла 88% точности на обучающем наборе и 87% на тестовом, с предсказанием F1-меры 0.89. Разрешающая способность информативных индексов (например, NDMI, CCC, FAPAR, chlorophyll red-edge index) была проверена на различиях в физиологических условиях в зараженных и нет зараженных полях. Это подтвердило работу системы на основе спутниковых данных для обнаружения паразитических видов в полевых условиях. ## Значимость Разработанная модель представляет собой надежное решение для повышения эффективности борьбы с branched broomrape в тепличных условиях. Она может быть применена в других сельскохозяйственных производствах, где вредители создают угрозу урожаям. Инновационный подхо

Annotation:

Branched broomrape (Phelipanche ramosa (L.) Pomel) is a chlorophyll-deficient parasitic plant that threatens tomato production by extracting nutrients from the host, with reported yield losses up to 80 percent. Its mostly subterranean life cycle and prolific seed production (more than 200,000 seeds per plant, viable for up to 20 years) make early detection essential. We present an end-to-end pipeline that uses Sentinel-2 imagery and time-series analysis to identify broomrape-infested tomato fiel...

ID: 2509.10804v1 eess.IV, cs.AI, cs.CV, cs.LG

arXiv PDF

Показано 41 - 50 из 100 записей