📚 Саммари научных статей из arXiv

Найдено 268 результатов по запросу 'eess.IV, cs.CV' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Comparative Analysis of GAN and Diffusion for MRI-to-CT translation

2025-09-30

Авторы:

Emily Honey, Anders Helbo, Jens Petersen

## Контекст Модели машинного обучения, обеспечивающие перевод между различными скантипами диагностических зонда, являются ключевыми для улучшения диагностических возможностей. Особенно это актуально в случае моделей, конвертирующих магнитно-резонансные изображения (MRI) в радиологически важные компьютерно-томографические (CT) снимки. Изображения CT широко используются в диагностике и лечении, однако их получение может быть затруднено из-за ограничений времени, оборудования или здоровья пациента. Создание прогностических моделей, которые могут генерировать CT-изображения из MRI, может решить эти проблемы. Однако существует необходимость в стандартной метрике для сравнения эффективности разных моделей. Целью данной работы является сравнение двух популярных моделей для MRI-to-CT перевода: генеративной сети противоположностей (cGAN) и диффузионной модели регулируемого размытия (cDDPM). ## Метод Для сравнительного анализа были выбраны две устаревшие, но проверенные модели: Pix2Pix для cGAN и Palette для cDDPM. Работа опиралась на существующие модели, чтобы гарантировать надежный анализ. Традиционный трехмерный перевод MRI-to-CT был сконцентрирован на последовательности 2D-переводов на горизонтальной плоскости (промежуточные трансверсальные срезы). Это позволило снизить вычислительную нагрузку и упростить моделирование. Кроме того, авторы исследовали влияние условного ввода на определенный срез MRI и на несколько срезов MRI. Метрики оценки включали новую slice-wise Similarity of Slices (SIMOS), которая оценивала устойчивость генерируемых изображений при сборке в 3D-формат. Это позволило измерить качество слэйсов, не только индивидуально, но и в целом. ## Результаты Результаты сравнения показали, что модель cDDPM (Palette) демонстрирует более высокую точность и последовательность срезов по сравнению с cGAN (Pix2Pix). С помощью SIMOS было выявлено, что использование нескольких срезов MRI в качестве условного ввода для cDDPM улучшает продолжительность и точность генерируемых изображений. Эти результаты подтверждают, что архитектура cDDPM более эффективна в MRI-to-CT переводе, особенно при использовании условного ввода с несколькими срезами. ## Значимость Результаты работы имеют значительное значение для области радиологии и диагностики. Эффективные методы перевода MRI-to-CT могут существенно сократить время диагностики и улучшить доступ к терапевтическим решениям. cDDPM может быть применено в различных случаях, например, когда CT-изображения отсутствуют или трудно получить. Помимо этого, исследование показывает возможность уменьшения вычислительных затрат за счет 2D-мо

Annotation:

Computed tomography (CT) is essential for treatment and diagnostics; In case CT are missing or otherwise difficult to obtain, methods for generating synthetic CT (sCT) images from magnetic resonance imaging (MRI) images are sought after. Therefore, it is valuable to establish a reference for what strategies are most effective for MRI-to-CT translation. In this paper, we compare the performance of two frequently used architectures for MRI-to-CT translation: a conditional generative adversarial ne...

ID: 2509.22049v1 eess.IV, cs.CV, cs.LG

arXiv PDF

📄 COMPASS: Robust Feature Conformal Prediction for Medical Segmentation Metrics

2025-09-30

Авторы:

Matt Y. Cheung, Ashok Veeraraghavan, Guha Balakrishnan

## Контекст В клинических приложениях, ценность сегментационных моделей часто определяется достоверностью полученных внешней метрики, таких как размер органа, а не пиксельной точностью сегментационных масок. Таким образом, квантификация неопределенности для таких метрик является критически важной для принятия обоснованных решений. Конформное предсказание (CP) — это популярная фреймворк для вывода подобных гарантий неопределенности, однако применение CP в непосредственном виде к окончательной скалярной метрике является неэффективным, так как он рассматривает нелинейную пайплайн сегментации-к-метрике в качестве черного ящика. Мы предлагаем COMPASS, усовершенствованный фреймворк, который генерирует эффективные, метрические CP-интервалы для изображений сегментации, используя индуктивные подсказки от глубоких нейронных сетей. COMPASS выполняет калибровку непосредственно в пространстве моделей представления, изменяя внутренние черты вдоль низкоразмерных подпространств, максимально чувствительных к целевой метрике. Мы доказали, что COMPASS обеспечивает достоверную покрытие маргинальное в случае заменяемости и вложенного свойства. ## Метод COMPASS является продвинутым подходом к квантификации неопределенности для метрик сегментации, используя мощь глубоких нейронных сетей. Он переносит процесс калибровки непосредственно в пространство внутренних представлений модели, а не работает с метрикой в качестве черного ящика. Основная идея заключается в использовании переноса представлений модели для построения валидных интервалов CP. Мы используем технологию переноса функций, чтобы определить низкоразмерные подпространства, которые имеют наибольшее влияние на целевую метрику. Эти подпространства используются для проведения калибровочных изменений, чтобы построить CP-интервалы. Мы доказали, что этот подход сохраняет валидность покрытия с учетом обменности и вложенности. ## Результаты Мы проверили эффективность COMPASS на четырёх задачах медицинской сегментации, включая оценку площади глаза и анатомических структур. Результаты показали, что COMPASS генерирует значительно тоньшие интервалы по сравнению с традиционными методами CP. Мы также продемонстрировали, что COMPASS поддерживает достоверность процедуры при ковариатных сдвигах, используя внутренние представления для оценки весов важности. Это доказывает, что COMPASS может обеспечить достоверную квантификацию неопределенности, даже в условиях изменения входных данных. ## Значимость COMPASS может применяться в медицинских приложениях для улучшения достоверности клинических определений, основанных на сегментационных моделях. Его преим

Annotation:

In clinical applications, the utility of segmentation models is often based on the accuracy of derived downstream metrics such as organ size, rather than by the pixel-level accuracy of the segmentation masks themselves. Thus, uncertainty quantification for such metrics is crucial for decision-making. Conformal prediction (CP) is a popular framework to derive such principled uncertainty guarantees, but applying CP naively to the final scalar metric is inefficient because it treats the complex, no...

ID: 2509.22240v1 eess.IV, cs.CV, cs.LG, stat.AP, stat.ML

arXiv PDF

📄 Optimal Transport Based Hyperspectral Unmixing for Highly Mixed Observations

2025-09-26

Авторы:

D. Doutsas, B. Figliuzzi

#### Контекст Корректное разделение спектральных данных на составляющие в задачах безупречного гиперспектрометрического разбора (blind hyperspectral unmixing, BHU) является ключевым для понимания взаимоотношений между объектами в спектральных сценах. Однако при работе с высокоступенчатыми смешанными данными (highly mixed observations), полученными из сложных сред, стандартные методы часто не справляются с задачей. Это приводит к ошибкам в выявлении эндмемберов (endmembers) и принадлежности образцов к ним. Недостаточность текущих подходов возникает из-за недостатка регуляризации и неэффективности в учете информации о распределении изотопичности. Необходимо развитие методов, которые бы лучше учитывали эти сложности. #### Метод Мы предлагаем новое решение, основанное на теории оптимального транспорта (optimal transport, OT), для решения вопросов связанных с высокой смешиваемостью данных в гиперспектрометрическом разборе. Метод использует OT для измерения расстояния между целевым (targeted) распределением абунданции (abundance distribution) и истинным распределением в природе. Это расстояние задается в виде регуляризационного условия в оптимизационной задаче. Модель построена так, чтобы лучше контролировать распределение абунданции в течение оптимизации. Эта новаторская модель позволяет выполнять более точное разделение составляющих даже при высокой смешиваемости данных. #### Результаты Мы проверили эффективность нашего подхода с помощью симуляционных данных и реальных спектров, полученных в условиях высокой смешиваемости. Для сравнения использовались стандартные методы, такие как N-FINDR и Vertex Component Analysis (VCA). Наши результаты показывают, что предложенный подход дает более точное разделение эндмемберов, особенно в случаях, когда традиционные методы дают завышенные ошибки. Мы также показали, что наше решение остается стабильным при различных целевых распределениях абунданции, что демонстрирует его надежность. #### Значимость Предложенный подход имеет широкие возможности применения в различных областях, включая спектрометрию, геологию, биологию и средиземноморские исследования. Наш метод особенно полезен в ситуациях, когда данные характеризуются высокой смешиваемостью и подвержены ошибкам в классических методах. Он предоставляет более точные оценки составляющих и демонстрирует высокую устойчивость к выбору целевого распределения. Это открывает новые перспективы для более точного анализа сложных спектральных сцен. #### Выводы Мы представили уникальный подход к гиперспектрометрическому разбору, основанный на теории оптимального транспорта. Метод позволя

Annotation:

We propose a novel approach based on optimal transport (OT) for tackling the problem of highly mixed data in blind hyperspectral unmixing. Our method constrains the distribution of the estimated abundance matrix to resemble a targeted Dirichlet distribution more closely. The novelty lies in using OT to measure the discrepancy between the targeted and true abundance distributions, which we incorporate as a regularization term in our optimization problem. We demonstrate the efficiency of our metho...

ID: 2509.20417v1 eess.IV, cs.CV, stat.AP

arXiv PDF

📄 Ensuring Reliable Participation in Subjective Video Quality Tests Across Platforms

2025-09-26

Авторы:

Babak Naderi, Ross Cutler

## Контекст Subjective video quality assessment (VQA) является золотым стандартом для измерения опыта пользователя в различных жанрах коммуникации, стриминга и создания пользовательского контента (User Generated Content, UGC). Несмотря на высокую точность лабораторных испытаний, когортизация позволяет более эффективно измерять качество видео, обеспечивая быстрый, доступный и дешевый подход. Однако она склонна к недостоверным ответам от участников, которые игнорируют инструкции или коптут систему в своих интересах. Недавние исследования показали, что участники прибегают к разным техникам, например, использованию метаданных видео и удаленных рабочих столов (Remote Desktop, RD), что приводит к дисторсии результатов. Этот анализ охватывает два типичных платформы для crowdsourcing'а и выявляет их уязвимость к этим проблемам, а также предлагает способы их устранения. ## Метод Исследование использует различные методы для выявления и контроля недостоверных ответов в субъективных тестах качества видео. Это включает в себя использование алгоритмов для определения нетрадиционных устройств, таких как RD-соединения, а также поиск способов контроля поведения участников. Особое внимание уделено разработке статистических и алгоритмических моделей, которые позволяют отличить реальные от специально созданных ответов. Архитектура исследования включает в себя систему мониторинга и анализа данных в реальном времени, чтобы обеспечить надежность процесса. ## Результаты Исследования показали, что участники, использующие RD-соединения, часто приводят к дисторсии результатов, поэтому для их определения используются специальные детекторы. В ходе экспериментов на двух платформах было обнаружено, что одна из них более уязвима к недостоверным ответам, но и обе требуют дополнительных мер контроля. Оптимизированные методы дали результаты, позволяющие существенно повысить уровень достоверности данных, исключив многочисленные случаи мошенничества. ## Значимость Предложенные методы могут быть использованы в различных областях, где необходимо высокое качество субъективных тестов, включая тестирование видео, телекоммуникации и потоковые сервисы. Использование этих методов позволяет повысить точность исследований, снизить риск мошенничества и обеспечить надежный выбор участников. Последствиями использования этого подхода является улучшение качества сервисов, более точное измерение пользовательского опыта и повышение доверия к субъективным испытаниям в различных технологических сферах. ## Выводы Результаты данного исследования показывают, что субъективные тесты качества видео могут быть оптимиз

Annotation:

Subjective video quality assessment (VQA) is the gold standard for measuring end-user experience across communication, streaming, and UGC pipelines. Beyond high-validity lab studies, crowdsourcing offers accurate, reliable, faster, and cheaper evaluation-but suffers from unreliable submissions by workers who ignore instructions or game rewards. Recent tests reveal sophisticated exploits of video metadata and rising use of remote-desktop (RD) connections, both of which bias results. We propose ob...

ID: 2509.20001v1 eess.IV, cs.CV, cs.MM

arXiv PDF

📄 Efficient Breast and Ovarian Cancer Classification via ViT-Based Preprocessing and Transfer Learning

2025-09-25

Авторы:

Richa Rawat, Faisal Ahmed

## Контекст Актуальность исследований в области раннего диагноза рака груди и овариям бесценна, так как эти заболевания находятся среди ведущих причин смертности у женщин. Несмотря на развитие медицинских технологий, существуют значительные проблемы, связанные с трудоемкостью и ресурсоемкостью традиционных методов диагностики. Традиционные подходы, основанные на ручном анализе импедиангов, компьютеризированных томографий и ультразвуковых изображений, требуют долгого времени и специализированных профессионалов. В этой статье предлагается использовать архитектуру Vision Transformer (ViT) для развития более эффективного метода классификации этих онкологических заболеваний. Технология ViT обеспечивает более точный и автоматизированный процесс диагностики, что сокращает время реагирования и повышает точность диагноза. ## Метод Для разработки метода классификации используется Vision Transformer с предобученной моделью ViT-Base-Patch16-224, которая адаптируется для классификации изображений на выборки BreakHis (для бинарной классификации) и UBC-OCEAN (для классификации на пять классов). Изображения вводятся в специальный препроцессинг-процесс, который преобразует импедианговые изображения в стандартизированные PyTorch-тензоры. Этот метод позволяет использовать ViT с меньшим временем обучения и повышенной точностью. Использование предобученной модели ViT существенно сокращает время обучения и позволяет достичь более высокой точности, чем при использовании традиционных CNN-моделей. Для обучения и тестирования использованы данные, которые не были предварительно усложнены с помощью аугментации. ## Результаты Проведенные эксперименты показали, что модель ViT-based превосходит в точности многие другие методы, включая CNN, ViT и данные, основанные на топологических данных, в бинарной классификации. Для классификации на пять классов, модель ViT-based показала высокую эффективность в сравнении с топологическими методами, использовавшимися ранее. Этот подход удалось повысить точность диагностики за счет точной препроцессинг-процедуры и предобученной модели ViT. Таким образом, эта модель демонстрирует значительное повышение точности классификации в сравнении с другими конкурентными алгоритмами. ## Значимость Результаты этого исследования имеют важное значение в области медицинских исследований, так как они позволяют существенно улучшить процесс классификации рака груди и оварий. Модель ViT-based может быть применена в различных областях, включая нейронные сети для диагностики и терапии рака. Улучшение точности диагностики может привести к более быстрому и то

Annotation:

Cancer is one of the leading health challenges for women, specifically breast and ovarian cancer. Early detection can help improve the survival rate through timely intervention and treatment. Traditional methods of detecting cancer involve manually examining mammograms, CT scans, ultrasounds, and other imaging types. However, this makes the process labor-intensive and requires the expertise of trained pathologists. Hence, making it both time-consuming and resource-intensive. In this paper, we in...

ID: 2509.18553v1 eess.IV, cs.CV, cs.LG

arXiv PDF

📄 Analysis Plug-and-Play Methods for Imaging Inverse Problems

2025-09-23

Авторы:

Edward P. Chandler, Shirin Shoushtari, Brendt Wohlberg, Ulugbek S. Kamilov

## Контекст Обработка изображений широко используется в медицине, радиологии, геологии, телекоммуникациях и других областях. Одна из наиболее вызовов в этой области — восстановление качественных изображений из искаженных данных, известных как задачи инверсных проблем в изображениях. Существуют многочисленные методы для решения этих задач, но далеко не все они эффективны или гибки в использовании. Например, стандартные подходы часто требуют настройки конкретных параметров или ручного вмешательства. Это сильно ограничивает их применение в реалистичных сценариях. Одним из перспективных подходов является Plug-and-Play Priors (PnP), который интегрирует точечные знания о природе изображений в виде денойсеров. Однако, обычно эти денойсеры работают непосредственно в изображении, что может ограничивать их эффективность в сложных задачах. Данная работа рассматривает итеративные алгоритмы данного подхода, в которых знания о природе изображений обрабатываются в преобразованном представлении, таком как градиент. Такой подход может повысить эффективность и гибкость в решении задач визуальной обработки. ## Метод Методология основывается на итеративных алгоритмах Plug-and-Play Priors с использованием градиентного представления. Техническое решение заключается в обучении денойсера для работы в градиентном пространстве, что дает возможность использовать знания о природе изображений в виде точечных знаний о направлении и изменении изображений. Архитектура предлагаемых алгоритмов APnP-HQS и APnP-ADMM основывается на популярных методах градиентного спуска и множественных уравнений в штатном режиме. В частности, алгоритм APnP-HQS использует повторные оптимизации градиентов с введением дополнительных штрафов в форме логарифмических приближений, тогда как APnP-ADMM аппроксимирует градиентное решение с помощью многоугольника в градиентной сетке. Таким образом, методы получают гибкий и эффективный инструмент для инверсных задач. ## Результаты Эксперименты проводились на наборах данных с изображениями неоднородности в разрешении 512x512 и 1024x1024. Использовались два типа данных: вымышленные и реальные изображения. Алгоритмы APnP-HQS и APnP-ADMM сравнивались с существующими подходами в задачах деблюринга и супер-разрешения. Результаты показали, что предложенные алгоритмы достигли показателей, которые не уступают стандартным методам PnP, при этом уменьшая требования к ресурсам. Особенно высокая эффективность была замечена в задаче деблюринга, где градиентно-преобразованный подход позволил улучшить разрешение изображений в

Annotation:

Plug-and-Play Priors (PnP) is a popular framework for solving imaging inverse problems by integrating learned priors in the form of denoisers trained to remove Gaussian noise from images. In standard PnP methods, the denoiser is applied directly in the image domain, serving as an implicit prior on natural images. This paper considers an alternative analysis formulation of PnP, in which the prior is imposed on a transformed representation of the image, such as its gradient. Specifically, we train...

ID: 2509.15422v1 eess.IV, cs.CV

arXiv PDF

📄 Prostate Capsule Segmentation from Micro-Ultrasound Images using Adaptive Focal Loss

2025-09-23

Авторы:

Kaniz Fatema, Vaibhav Thakur, Emad A. Mohammed

## Контекст Микро-ультразвук (мк-ультразвук) является продвинутой методологией в области обнаружения рака и компьютерного визуализационного анализа. Одной из сложностей, с которой сталкивается данная область, является точная сегментация простатной капсулы из микро-ультразвуковых изображений. Эта задача становится вызовом из-за неоднозначности границ простатной капсулы, что приводит к неточностям в медицинских выводах. Существующие методы часто сталкиваются с ограничениями в учете этих неоднозначностей, что создает мотивацию для разработки более точных и гибких методов. В данной работе предлагается новая адаптивная фокусная функция потерь, которая динамически адаптируется к трудностям сегментации, учитывая индивидуальные особенности задачи. ## Метод На основе стандартной фокусной функции потерь разработана адаптивная функция потерь, которая включает в себя два основных подхода. Первый подход заключается в использовании стандартной фокусной функции потерь, которая стабилизирует модель и обеспечивает базовый уровень точности. Второй подход включает в себя адаптивные изменения функции потерь, которые акцентуруются на трудных областях, таких как нечеткие границы простатной капсулы. Для этого вводится гибкое динамическое дофильтрование, которое учитывает отклонения между анализами экспертов и неэкспертов. Это позволяет модели адаптироваться к неоднозначным областям и динамически корректировать веса сегментационной модели. ## Результаты Проведенные эксперименты показали, что предлагаемая модель демонстрирует выдающиеся результаты. Метрика Dice Coefficient (DSC) достигла значения 0.940, а метрика Hausdorff Distance (HD) составила 1.949 мм на тестовой выборке. Эти результаты указывают на высокую точность и эффективность использования адаптивных фокусных функций потерь. Такой подход позволяет модели более точно определять нечеткие и трудные области простатной капсулы, что имеет значительное значение для повышения точности в диагностике и планировании лечения рака простаты. ## Значимость Разработанная методика имеет большое значение для как медицинских, так и компьютерных приложений. Она может быть применена в диагностике рака простаты, планировании хирургических операций и мониторинге терапии. Ее основное преимущество заключается в том, что она динамически адаптируется к сложностям сегментации, обеспечивая более точные и надежные результаты. Это может существенно повлиять на прогнозирование и лечение рака, повышая точность и эффективность клинических решений. ## Выводы Результаты проведенных исследований подтверждают эффектив

Annotation:

Micro-ultrasound (micro-US) is a promising imaging technique for cancer detection and computer-assisted visualization. This study investigates prostate capsule segmentation using deep learning techniques from micro-US images, addressing the challenges posed by the ambiguous boundaries of the prostate capsule. Existing methods often struggle in such cases, motivating the development of a tailored approach. This study introduces an adaptive focal loss function that dynamically emphasizes both hard...

ID: 2509.15595v1 eess.IV, cs.CV

arXiv PDF

📄 Uncertainty-Gated Deformable Network for Breast Tumor Segmentation in MR Images

2025-09-23

Авторы:

Yue Zhang, Jiahua Dong, Chengtao Peng, Qiuli Wang, Dan Song, Guiduo Duan

## Контекст Сегментация маститных опухолей на магнитных резонансных изображениях (MRI) является критически важной задачей в диагностике рака груди. Однако, существующие методы сталкиваются с рядом проблем, в том числе неэффективностью в адаптивной моделировании неоднородных форм опухолей и недостаточностью интеграции локальных и глобальных признаков. Эти ограничения приводят к неточностям в области сегментации, что может повлиять на качество диагностики. Наша цель заключается в разработке метода, который мог бы эффективно обрабатывать эти проблемы, обеспечивая точную сегментацию. ## Метод Мы предлагаем **Uncertainty-Gated Deformable Network (UGDN)**, который объединяет преимущества методов CNN и Transformer. Наш подход включает моделирование деформации в обеих сетях, что позволяет адаптивно регулировать режимы приёма при помощи деформативных модулей. Мы также представляем **Uncertainty-Gated Enhancing Module (U-GEM)**, которое адаптивно обменивается признаками между CNN и Transformer на основе пиксельной неопределённости. Для улучшения определения краев опухоли мы вводим Boundary-Sensitive Deep Supervision Loss. Это позволяет улучшить точность разметки и обеспечить более точное детектирование краев опухоли. ## Результаты Мы проводили эксперименты на двух клинических датасетах MRI, полученных у пациентов с раком груди. Наши результаты показали, что UGDN превосходит современные методы сегментации по метрикам Dice Similarity Coefficient (DSC) и Intersection over Union (IoU). Эксперименты подтвердили эффективность метода в моделировании неоднородных форм опухолей и интеграции локальных и глобальных признаков. Мы также проанализировали неопределённость в сегментации, показав, что U-GEM позволяет выбирать оптимальные компоненты из CNN и Transformer для каждого пикселя. ## Значимость Метод UGDN может быть применён в различных областях медицины, где требуется точная сегментация медицинских изображений. Основные преимущества включают в себя улучшенную точность сегментации, универсальность и гибкость в моделировании неоднородных форм опухолей. Мы предвидим, что этот подход может иметь потенциал для улучшения качества диагностики и лечения рака груди, повышая роль машинного обучения в этой сфере. ## Выводы Мы представили новую сеть, которая эффективно обрабатывает проблемы сегментации маститных опухолей на MRI. Наши результаты показали, что UGDN превосходит существующие методы, обеспечивая точную сегментацию и имея потенциал для клинического применения. Мы планируем расширить нашу работу, включив более широкий спектр вариантов заболеваний и других медицинских изображений.

Annotation:

Accurate segmentation of breast tumors in magnetic resonance images (MRI) is essential for breast cancer diagnosis, yet existing methods face challenges in capturing irregular tumor shapes and effectively integrating local and global features. To address these limitations, we propose an uncertainty-gated deformable network to leverage the complementary information from CNN and Transformers. Specifically, we incorporates deformable feature modeling into both convolution and attention modules, ena...

ID: 2509.15758v1 eess.IV, cs.CV

arXiv PDF

📄 DPC-QA Net: A No-Reference Dual-Stream Perceptual and Cellular Quality Assessment Network for Histopathology Images

2025-09-23

Авторы:

Qijun Yang, Boyang Wang, Hujun Yin

#### Контекст Обеспечение качества цифровых видеоресурсов (WSI) в поле клетческой патологии является ключевым фактором для повышения достоверности работы лонгопатологов. Несмотря на развитие технологий, в WSI часто встречаются различные дефекты, такие как стёковая формирования, выделение клеток и видимые ненасыщенности. Такие проблемы могут привести к неточности диагноза и снижению эффективности исследований. Настоящая работа посвящена разработке метода, который может эффективно оценивать и характеризировать качество WSI не зависимо от наличия специальных модификаций или специальных метрик. #### Метод DPC-QA Net — это неучитывающая контрольную (no-reference) сеть с двумя структурными потоками (dual-stream network), которая использует глобальные наблюдения по волновой трансформации и скрытые представления клетки (nuclear и membrane) для оценки качества. Для объединения этих двух потоков используется модуль Aggr-RWKV, разработанный на основе методов трансформации. Кроме того, сеть включает в себя кросс-аттенционные механизмы и многотерминальные потери (multi-term losses) для корректного выравнивания когнитивных и морфологических сигналов. #### Результаты На основе DPC-QA Net были проведены эксперименты на нескольких наборах данных, включая LIVEC, KonIQ и другие. Модель демонстрировала высокую точность (>92%) при выявлении различных дефектов в WSI, таких как стёковая формирования, дефокус и клетческие проблемы. Она показала сильное согласие с оценками пригодности к использованию (usability scores) и важностью найденных дефектов. Также, DPC-QA Net была применена в пост-процессинговом исследовании, показав сильную корреляцию между оценкой качества и точностью распознавания клеток (например, PQ/Dice для ядерных клеток и F-score для границ мембран). #### Значимость DPC-QA Net открывает новые перспективы в автоматической оценке качества WSI, предоставляя эффективный инструмент для предварительной фильтрации данных в системах компьютерной патологии. Модель может быть применена для оптимизации процесса диагностики, предотвращения неточностей и улучшения производительности систем искусственного интеллекта в патологической практике. #### Выводы DPC-QA Net доказала свою эффективность в детектировании различных дефектов в WSI и корреляцию с компьютерной патологической практикой. Будущие исследования будут сфокусированы на расширении модели для учитывания разнообразия диагнозных образов, а также на доработке методов для включения сложных клинических сценариев.

Annotation:

Reliable whole slide imaging (WSI) hinges on image quality,yet staining artefacts, defocus, and cellular degradations are common. We present DPC-QA Net, a no-reference dual-stream network that couples wavelet-based global difference perception with cellular quality assessment from nuclear and membrane embeddings via an Aggr-RWKV module. Cross-attention fusion and multi-term losses align perceptual and cellular cues. Across different datasets, our model detects staining, membrane, and nuclear iss...

ID: 2509.15802v1 eess.IV, cs.CV

arXiv PDF

📄 QWD-GAN: Quality-aware Wavelet-driven GAN for Unsupervised Medical Microscopy Images Denoising

2025-09-23

Авторы:

Qijun Yang, Yating Huang, Lintao Xiang, Hujun Yin

#### Контекст Развитие медицинских технологий в последние десятилетия сильно подталкивает область подготовки и обработки изображений, особенно в рамках микроскопического исследования. Одна из ключевых задач в этой области — удаление шума из изображений, которая критически важна для точного диагностического анализа. Несмотря на прогресс в глубоком обучении, существуют проблемы, такие как ухудшение качества при удалении шума, недостаточная эффективность алгоритмов, а также нехватка отклика на клинические потребности. Общая мотивация заключается в создании метода, который бы одновременно улучшал качество изображений, сохранял критически важную структуру данных, и обеспечивал совместимость с различными моделями. #### Метод Мы предлагаем QWD-GAN — метод основанный на генерирующей адверсарной сети (GAN), который применяет многомерную адаптивную модель на основе Wavelet Transform для генерации чистого изображения. Генератор работает на нескольких масштабах, что позволяет эффективно удалять шум в разных частях изображения. Дискриминатор состоит из двух ветвей: одна воспринимает различия между чистым и шумным изображением, а другая — анализирует оригинальные свойства изображения. Это сочетание позволяет модели полностью учитывать как структурные, так и интерактивные особенности. Модель может работать в несупервизированном режиме, что увеличивает её гибкость и реальность применения в ситуациях, где данных для обучения ограничены. #### Результаты Мы проверили QWD-GAN на нескольких наборах данных медицинских микроскопических изображений, включая данные с широким диапазоном шумов. Модель показала значительное преимущество по сравнению с другими подходами в ряде ключевых показателей, таких как PSNR (Peak Signal-to-Noise Ratio) и SSIM (Structural Similarity Index). Особенно заметны улучшения в сохранении высокочастотной информации, которая критическая для детализации структур в изображениях. Эксперименты подтверждают высокую эффективность QWD-GAN в сложных условиях изображения и её пригодность для клинических задач. #### Значимость Модель QWD-GAN оказалась полезной во многих областях, включая диагностическую медицину, генетические исследования и выявление тканевых изменений. Один из основных преимуществ заключается в том, что модель может быть интегрирована с разными архитектурами GAN, что увеличивает её универсальность. Более того, сохранение высокочастотной информации делает QWD-GAN привлекательным для задач, где точность воспроизведения деталей имеет высокий приоритет. Мы видим будущее развитие модели в улучшении скорости обработки и увеличении её применения в реальном вре

Annotation:

Image denoising plays a critical role in biomedical and microscopy imaging, especially when acquiring wide-field fluorescence-stained images. This task faces challenges in multiple fronts, including limitations in image acquisition conditions, complex noise types, algorithm adaptability, and clinical application demands. Although many deep learning-based denoising techniques have demonstrated promising results, further improvements are needed in preserving image details, enhancing algorithmic ef...

ID: 2509.15814v1 eess.IV, cs.CV

arXiv PDF

1
2
10
11
12
13
14
26
27

Показано 111 - 120 из 268 записей