📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 AttentionViG: Cross-Attention-Based Dynamic Neighbor Aggregation in Vision GNNs

2025-10-02

Авторы:

Hakan Emre Gedik, Andrew Martin, Mustafa Munir, Oguzhan Baser, Radu Marculescu, Sandeep P. Chinchali, Alan C. Bovik

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Vision Graph Neural Networks (ViGs) have demonstrated promising performance in image recognition tasks against Convolutional Neural Networks (CNNs) and Vision Transformers (ViTs). An essential part of the ViG framework is the node-neighbor feature aggregation method. Although various graph convolution methods, such as Max-Relative, EdgeConv, GIN, and GraphSAGE, have been explored, a versatile aggregation method that effectively captures complex node-neighbor relationships without requiring archi...

ID: 2509.25570v1 cs.CV, cs.AI, eess.IV

arXiv PDF

📄 A Data-Centric Perspective on the Influence of Image Data Quality in Machine Learning Models

2025-10-01

Авторы:

Pei-Han Chen, Szu-Chi Chung

#### Контекст Исследования в области машинного обучения (МО) становятся все более направленными на развитие моделей, но все чаще набирает силу роль качества данных в обучении. Традиционно, в качестве тренировочных данных используются объемные, но не всегда чистые коллекции, что может снизить эффективность моделей. Особенно актуально это в изображениях, где зачастую имеются различные дефекты, влияющие на качество обучения. Несмотря на важность этого аспекта, научно-исследовательская литература относительно недостаточно раскрывает методы оценки и улучшения качества изображений для моделей МО. Учитывая это, данная работа будет сосредоточена на поиске решений для оценки качества изображений в обучающих данных и определении степени влияния качества на модели МО. #### Метод Для анализа качества изображений в работе используется множество методов, включая автоматическую технику оценки дефектов в изображениях, а также сравнение их между собой. Для проверки эффективности различных методов, в ходе экспериментов были использованы обучающие данные из набора CIFAKE. Этот набор данных является достаточно чистым, что позволяет более точно определить влияние различных уровней изображения на модели. Для обнаружения и удаления дефектов в изображениях, авторы работы предлагают интегрировать две открытой доступа инструменты: CleanVision и Fastdup. Кроме того, в процессе работы были внедрены дополнительные методы, в том числе автоматическая настройка порогов для обнаружения проблемных изображений, чтобы уменьшить необходимость вручную регулировать эти параметры. #### Результаты Исследования показали, что не все дефекты одного уровня имеют одинаковое влияние на модель. Точнее, модели сверточных нейронных сетей (СНС), которые обычно являются наиболее подверженными дефектам, оказались весьма жесткими в отношении мелких дефектов, но очень чуствительны к достаточно существенным дефектов, таким как размытие или сильное уменьшение разрешения изображения. В ходе экспериментов, для оценки качества обучения, использовались показатели F1-меры, которые позволяют измерить точность и полноту распознавания низкокачественных изображений. Таким образом, авторы работы могли оценить влияние различных уровней дефектов на модель. Например, автоматический подбор порогов для обнаружения проблемных изображений оказался эффективным, чтобы значительно улучшить оценку F1-меры. #### Значимость Результаты работы имеют широкую полезность для разных областей, где требуется высокая точность моделей МО. В частности, в сферах, где качество обучающих данных может отличаться, например, в медицине, недвижимости, или мониторинге зон

Annotation:

In machine learning, research has traditionally focused on model development, with relatively less attention paid to training data. As model architectures have matured and marginal gains from further refinements diminish, data quality has emerged as a critical factor. However, systematic studies on evaluating and ensuring dataset quality in the image domain remain limited. This study investigates methods for systematically assessing image dataset quality and examines how various image quality ...

ID: 2509.24420v1 cs.CV, cs.AI, eess.IV

arXiv PDF

📄 Gaussian Primitive Optimized Deformable Retinal Image Registration

2025-08-27

Авторы:

Xin Tian, Jiazheng Wang, Yuxi Zhang, Xiang Chen, Renjiu Hu, Gaolei Li, Min Liu, Hang Zhang

## Контекст Поиск эффективных методов регистрации деформируемых сетчатки глаза является ключевым вопросом в оптической координации и медицинской информатике. Несмотря на развитие методов машинного обучения, регистрация деформированных сетчаток глаза остается сложной задачей из-за простых зон и сильно выраженных искажений. Недостаток градиентных сигналов в стандартных решениях часто приводит к ошибкам в регистрации. Эта проблема вносит значительные затруднения в клинических применениях, таких как микроскопическая операция в опточной координации. Данная работа адресует эти сложности, предлагая новый подход для регистрации деформируемых сетчаток глаза. ## Метод Предложенный подход, Gaussian Primitive Optimization (GPO), опирается на многослойную архитектуру с использованием ключевых точек, распределенных по сетчатке глаза. Ключевые точки определяются на базе самых выраженных анатомических структур, таких как крупные сети сосудов. Для каждой ключевой точки используется гибкая модель, описываемая Гауссовыми примитивами, которая позволяет адаптироваться к локальным изометрическим изображениям. Затем, используя K-ближайших соседей (KNN), распространяются градиентные сигналы от ключевых точек к соседним регионам, обеспечивая глобальную консистентность деформационного поля. Метод оптимизируется с помощью многоугольной функции потерь, которая использует согласование ключевых точек и интенсивности изображений. ## Результаты Эксперименты проводились на датасете FIRE, где сравнивались результаты GPO с другими современными методами регистрации. Результаты показывают, что GPO существенно улучшает точность регистрации: точность повышается до ~2.4 пикселей по отношению к исходному решению, который давал ошибки ~6.2 пикселей. Кроме того, повышение AUC (Area Under Curve) достигло значительных показателей, 0.938 по сравнению с 0.770 у существующих решений. Эти результаты подтверждают эффективность GPO в решении проблем с ранее выявленными ограничениями. ## Значимость Разработанный подход имеет широкие перспективы в медицинских применениях. Он может применяться в оптической координации для улучшения точности визуального мониторинга в реальном времени. Благодаря своей гибкости и удачному подходу к решению проблемы недостатка градиентных сигналов, GPO может стать ключевым инструментом для решения задач регистрации даже в условиях высокой деформации и простых регионов. ## Выводы Результаты показывают, что GPO является эффективным инструментом для решения проблем регистрации деформируемых сетчаток глаза. В будущем планируется ра

Annotation:

Deformable retinal image registration is notoriously difficult due to large homogeneous regions and sparse but critical vascular features, which cause limited gradient signals in standard learning-based frameworks. In this paper, we introduce Gaussian Primitive Optimization (GPO), a novel iterative framework that performs structured message passing to overcome these challenges. After an initial coarse alignment, we extract keypoints at salient anatomical structures (e.g., major vessels) to serve...

ID: 2508.16852v1 cs.CV, cs.AI, eess.IV

arXiv PDF

📄 A Classification-Aware Super-Resolution Framework for Ship Targets in SAR Imagery

2025-08-12

Авторы:

Ch Muhammad Awais, Marco Reggiannini, Davide Moroni, Oktay Karakus

## Контекст Область исследования связана с развитием алгоритмов для повышения разрешения изображений в синтетическом апертурном радиолокации (SAR). Это критически важно для улучшения качества визуального анализа и автоматизированного распознавания объектов, таких как суда. Однако существуют существующие проблемы, такие как несоответствие между качеством изображений, полученных с помощью суперрезолюционных (SR) техник, и их влиянием на алгоритмы классификации. Многие традиционные подходы ориентированы только на улучшение пиксельного качества, не учитывая то, как эти улучшения влияют на точность классификации. Эта проблема является мотивацией для разработки методов, которые могут оптимизировать как изображение, так и его классификационную точность. ## Метод Методология, предложенная в статье, основывается на разработке алгоритма, который не только повышает разрешение SAR-изображений, но и оптимизирует классификационную точность. Авторы использовали усовершенствованные функции потерь, которые учитывают как метрики качества изображения (например, PSNR, SSIM), так и метрики классификационной точности. Архитектура предложенного подхода включает в себя нейронные сети с глубокими слоями, которые работают в двух режимах: режиме повышения разрешения и режиме классификации. Инновационность заключается в интеграции этих режимов в единую структуру, что позволяет достичь оптимального баланса между качеством изображения и его классификационной точностью. ## Результаты Эксперименты были проведены на наборе данных, содержащих SAR-изображения судов с разным уровнем разрешения. Авторы использовали как стандартные метрики качества (например, PSNR, SSIM), так и метрики классификационной точности (например, accuracy, F1-score). В результате показано, что предложенный подход не только повышает разрешение изображений, но и улучшает точность классификации. Это достигается благодаря интеграции классификационной функции в процесс повышения разрешения, что делает изображение более информативным для алгоритмов классификации. ## Значимость Предложенный подход имеет широкие области применения в сферах, требующих высокого качества изображений, таких как удаленное снятие, системы безопасности и системы наблюдения. Одним из основных преимуществ является улучшение качества изображений судов, что влияет на точность распознавания. Это может привести к значительным улучшениям в автоматизированных системах наблюдения и контроля. Дальнейшие исследования могут быть направлены на расширение метода на другие типы объектов и уточнение алгоритмов для решения конкретных проблем в област

Annotation:

High-resolution imagery plays a critical role in improving the performance of visual recognition tasks such as classification, detection, and segmentation. In many domains, including remote sensing and surveillance, low-resolution images can limit the accuracy of automated analysis. To address this, super-resolution (SR) techniques have been widely adopted to attempt to reconstruct high-resolution images from low-resolution inputs. Related traditional approaches focus solely on enhancing image q...

ID: 2508.06407v1 cs.CV, cs.AI, eess.IV

arXiv PDF

Показано 11 - 14 из 14 записей