📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня
Авторы:

Nabiha Choudhury, Jianqing Jia, Yifei Lou

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Total variation (TV) regularization is a classical tool for image denoising, but its convex $\ell_1$ formulation often leads to staircase artifacts and loss of contrast. To address these issues, we introduce the Transformed $\ell_1$ (TL1) regularizer applied to image gradients. In particular, we develop a TL1-regularized denoising model and solve it using the Alternating Direction Method of Multipliers (ADMM), featuring a closed-form TL1 proximal operator and an FFT-based image update under peri...
ID: 2511.15060v1 eess.IV, cs.CV, math.OC
Авторы:

Rui Wang, Zeming Wei, Xiyue Zhang, Meng Sun

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Deep Neural Networks (DNNs) are known to be vulnerable to various adversarial perturbations. To address the safety concerns arising from these vulnerabilities, adversarial training (AT) has emerged as one of the most effective paradigms for enhancing the robustness of DNNs. However, existing AT frameworks primarily focus on a single or a limited set of attack types, leaving DNNs still exposed to attack types that may be encountered in practice but not addressed during training. In this paper, we...
ID: 2511.12265v1 cs.LG, cs.AI, cs.CR, cs.CV, math.OC
Авторы:

Xinyu Wang, Wenjun Yao, Fanghui Song, Zhichang Guo

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Image segmentation is a core task in image processing, yet many methods degrade when images are heavily corrupted by noise and exhibit intensity inhomogeneity. Within the iterative-convolution thresholding method (ICTM) framework, we propose a variational segmentation model that integrates denoising terms. Specifically, the denoising component consists of an I-divergence term and an adaptive total-variation (TV) regularizer, making the model well suited to images contaminated by Gamma--distribut...
ID: 2511.08988v1 cs.CV, math.OC
Авторы:

Manuel Weiß, Lukas Baumgärtner, Roland Herzog, Stephan Schmidt

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We introduce a new paradigm for geometry denoising using prior knowledge about the surface normal vector. This prior knowledge comes in the form of a set of preferred normal vectors, which we refer to as label vectors. A segmentation problem is naturally embedded in the denoising process. The segmentation is based on the similarity of the normal vector to the elements of the set of label vectors. Regularization is achieved by a total variation term. We formulate a split Bregman (ADMM) approach t...
ID: 2511.04848v1 cs.CV, math.OC
Авторы:

Zicong Zhou, Baihan Zhao, Andreas Mang, Guojun Liao

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
This paper introduces VPreg, a novel diffeomorphic image registration method. This work provides several improvements to our past work on mesh generation and diffeomorphic image registration. VPreg aims to achieve excellent registration accuracy while controlling the quality of the registration transformations. It ensures a positive Jacobian determinant of the spatial transformation and provides an accurate approximation of the inverse of the registration, a crucial property for many neuroimagin...
ID: 2510.13109v1 cs.CV, math.OC, 49J20, 49K20, 49N45
Авторы:

Ziwei Zou, Bei Zou, Xiaoyan Kui, Wenqi Lu, Haoran Dou, Arezoo Zakeri, Timothy Cootes, Alejandro F Frangi, Jinming Duan

#### Контекст Атлас-конструкция является основополагающим аспектом медицинского анализа изображений, предоставляя стандартизированные спациальные ссылки для задач, таких как моделирование анатомии на уровне населения. Регистрационные методы на основе данных показали удачные результаты в парном контексте, однако ограниченность их обучающими данными, недостаточной универсальностью и отсутствием истинной инференциальной фазы в групповом контексте ограничивают их практическую применимость. Модельно-направленные методы, напротив, предлагают тренировочно-свободные, теоретически обоснованные и эффективные в плане данных альтернативы. Тем не менее, применение таких подходов к большим 3D-датасетам часто сталкивается с проблемами масштабируемости и оптимизации. В данной работе мы предлагаем DARC (Diffeomorphic Atlas Registration via Coordinate Descent) — новую модельно-направленную систему для регистрации изображений, ориентированную на конструкцию атласа. DARC поддерживает широкий класс метрик различия изображений и эффективно обрабатывает большие 3D-датасеты без проблем с памятью GPU. #### Метод DARC основывается на стратегии координатного спуска и использует активационную функцию, нацеленную на поддержание центральности, для достижения дифформационной атлас-конструкции. Он эффективно работает с алгоритмами регистрации любого уровня сложности и поддерживает различные метрики различий изображений, такие как Маттьюссен, МОРДОКА, Ниджелл и др. Кроме того, DARC эффективно обрабатывает произвольное число изображений, используя компактную архитектуру, не требующую больших ресурсов GPU. Это позволяет создавать анатомически точные и дифформационно безотказные атласы. Благодаря гибкости в выборе метрик различия, DARC может быть адаптирован к различным медицинским задачам. #### Результаты Мы проверили DARC на нескольких значимых медицинских датасетах, включая 3D-изображения головного мозга и сердца. Результаты показали, что DARC превосходит современные методы, обеспечивая высокую точность и низкий уровень артефактов. Также мы продемонстрировали его эффективность в приложениях, таких как одно-проходное сегментирование (one-shot segmentation) и синтез анатомических форм. В случае one-shot segmentation, DARC показал существенные выигрыши по сравнению с состоянием технологии, выдавая более точные результаты с меньшим числом аннотаций. #### Значимость DARC предлагает широкие возможности для медицинских приложений, включая моделирование анатомии, сегментацию и синтез анатомических моделей. Его основные преимущества заключаются в том,
Annotation:
Atlas construction is fundamental to medical image analysis, offering a standardized spatial reference for tasks such as population-level anatomical modeling. While data-driven registration methods have recently shown promise in pairwise settings, their reliance on large training datasets, limited generalizability, and lack of true inference phases in groupwise contexts hinder their practical use. In contrast, model-driven methods offer training-free, theoretically grounded, and data-efficient a...
ID: 2508.10743v1 cs.CV, math.OC
Авторы:

Olakunle S. Abawonse, Günay Doğan

#### Контекст Область исследований, посвященная методам сегментации изображений, широко применяется в различных областях, таких как медицина, геология, графика и анализ цифровых изображений. Одна из основных проблем в этой области заключается в том, чтобы разделить объект на две независимые части, например, фоновую и переднюю сцену. Эти методы имеют практическое применение в рендеринге, а также в выделении определенных фигур или объектов на изображении. Мотивация для этого исследования лежит в том, чтобы разработать эффективный алгоритм для двухфазной сегментации, который может обеспечить точное разделение фона и передней сцены. #### Метод В данной работе представлена реализация алгоритма двухфазной сегментации, основанного на методе Split Bregman. Эта методология представляет собой метод оптимизации, в которой проблема двухфазной сегментации разбивается на две подзадачи, каждая из которых решается раздельно. Метод Split Bregman позволяет эффективно решать задачи с ограничениями, которые невозможно решить прямым использованием методов градиентного спуска. Реализация построена на основе следующих шагов: 1. Инициализация регионов (фон и передняя сцена); 2. Оптимизация энергетической функции с использованием метода Split Bregman; 3. Обновление регионов до тех пор, пока не будет достигнуто оптимальное решение. Технически, данный алгоритм основывается на модели двухфазной сегментации, в которой пиксели изображения приписываются одному из двух регионов (фон или передняя сцена). Эти регионы определяются с помощью энергетической функции, включающей в себя слагаемые для изображения и штраф за границы регионов. Метод Split Bregman используется для эффективного решения задачи оптимизации. #### Результаты Для проверки эффективности реализованного алгоритма проведены несколько экспериментов на различных изображениях. Использовались изображения с разным контрастом, разрешением и наличием шумов. Для каждого изображения была применена реализованная реализация двухфазной сегментации, и результаты сравнивались с результатами существующих методов. На основе экспериментов было получено следующее: - Алгоритм показал высокую точность разделения фона и передней сцены, особенно в случае с изображениями с высоким контрастом; - Решение было достигнуто за меньшее число итераций по сравнению с другими методами; - Изменение параметров алгоритма позволяет корректировать точность разделения. Эти результаты указывают на эффективность и надежность разработанного метода. #### Значимость Реализованный алгоритм может быть при
Annotation:
In this paper, we describe an implementation of the two-phase image segmentation algorithm proposed by Goldstein, Bresson, Osher in \cite{gold:bre}. This algorithm partitions the domain of a given 2d image into foreground and background regions, and each pixel of the image is assigned membership to one of these two regions. The underlying assumption for the segmentation model is that the pixel values of the input image can be summarized by two distinct average values, and that the region boundar...
ID: 2508.06351v1 cs.CV, math.OC
Авторы:

Chen Luo, Qiyu Jin, Taofeng Xie, Xuemei Wang, Huayu Wang, Congcong Liu, Liming Tang, Guoqing Chen, Zhuo-Xu Cui, Dong Liang

Задача интерполяции отсутствующих данных в k-space является ключевой для ускорения медицинской импедансной сканирования. Несмотря на то, что существующие процедуры, основанные на convolutional neural networks (CNN), эффективно используют локальные зависимости, они недостаточно прислушиваются к глобальным зависимостям в k-space. Недавние прогрессы в области transformers, вызванные их успехом в обработке естественного языка и глубокого анализе изображений, показали, что они могут способствовать лучшему использованию глобальных структур в k-space. Однако их критическая проблема заключается в непонятности решений. Мы предлагаем GPI-WT, новый white-box Transformer в рамках Global Predictable Interpolation (GPI), который формализуется в качестве аннигиляционной модели low-rank для k-space. Мы рассматриваем мировые фильтры аннигиляции как обучаемые параметры и индуцируемый subgradient-оптимизационный процесс специальную attention-механику. Наши эксперименты показали, что GPI-WT превосходит состояние технологий в точности интерполяции в k-space и обеспечивает высокую интерпретируемость результатов.
Annotation:
Interpolating missing data in k-space is essential for accelerating imaging. However, existing methods, including convolutional neural network-based deep learning, primarily exploit local predictability while overlooking the inherent global dependencies in k-space. Recently, Transformers have demonstrated remarkable success in natural language processing and image analysis due to their ability to capture long-range dependencies. This inspires the use of Transformers for k-space interpolation to ...
ID: 2508.04051v1 cs.CV, math.OC