📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Cost Savings from Automatic Quality Assessment of Generated Images

2025-10-22

Авторы:

Xavier Giro-i-Nieto, Nefeli Andreou, Anqi Liang, Manel Baradad, Francesc Moreno-Noguer, Aleix Martinez

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Deep generative models have shown impressive progress in recent years, making it possible to produce high quality images with a simple text prompt or a reference image. However, state of the art technology does not yet meet the quality standards offered by traditional photographic methods. For this reason, production pipelines that use generated images often include a manual stage of image quality assessment (IQA). This process is slow and expensive, especially because of the low yield of automa...

ID: 2510.16179v1 cs.CV, I.4.9

arXiv PDF

📄 SETR: A Two-Stage Semantic-Enhanced Framework for Zero-Shot Composed Image Retrieval

2025-10-02

Авторы:

Yuqi Xiao, Yingying Zhu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Zero-shot Composed Image Retrieval (ZS-CIR) aims to retrieve a target image given a reference image and a relative text, without relying on costly triplet annotations. Existing CLIP-based methods face two core challenges: (1) union-based feature fusion indiscriminately aggregates all visual cues, carrying over irrelevant background details that dilute the intended modification, and (2) global cosine similarity from CLIP embeddings lacks the ability to resolve fine-grained semantic relations. To ...

ID: 2509.26012v1 cs.CV, I.4.9

arXiv PDF

📄 Palmistry-Informed Feature Extraction and Analysis using Machine Learning

2025-09-05

Авторы:

Shweta Patil

## Контекст Гидрометеорология — это наука, которая изучает взаимосвязи между водой в природе и климатом. В современных условиях, связанных с изменением климата и ростом потребности в водных ресурсах, эта область исследования приобрела критическое значение. Одной из проблем является недостаточная информативность и актуальность данных, получаемых с помощью традиционных методов наблюдения. Это влечет за собой неточности в прогнозах погоды и климата, что может привести к негативным последствиям для экономики и безопасности. Мотивацией для данного исследования является развитие более точных и эффективных методов моделирования и анализа гидрометеорологических данных. ## Метод Для решения поставленных задач был разработан специальный методологический подход, который включал в себя несколько ключевых этапов. Вначале проводился предварительный анализ исходных данных, включая временную серию погодных показателей и гидрологических показателей. Затем, было применено методы машинного обучения, такие как регрессия, классификация и сети глубинного обучения, для моделирования и прогнозирования климатических и гидрологических показателей. Также были использованы методы геоинформационного моделирования для географического распределения данных. Архитектура решения включала в себя нейронные сети, которые обрабатывали данные с различных источников, таких как спутниковые снимки, метеорологические станции и гидрологические системы. ## Результаты На основе разработанного подхода были проведены эксперименты с использованием реальных данных, полученных с помощью спутниковых наблюдений и гидрологических систем. Были получены прогнозы погодных и гидрологических показателей, в том числе температуры, влажности, скорости ветра и уровня воды в реке. Эти прогнозы были сравнены с реальными данными, что позволило оценить точность и эффективность разработанного алгоритма. Оказалось, что методы машинного обучения позволяют достичь приемлемой точности с учетом всех погрешностей и шумов в данных. ## Значимость Разработанный подход имеет широкие возможности для применения в различных областях. Он может быть использован для моделирования климатических процессов, улучшения прогнозов погоды, а также для оптимизации использования водных ресурсов. Это может привести к улучшению безопасности, эффективности энергосбыта, а также поддержки решений в сфере управления природными ресурсами. Благодаря использованию машинного обучения, этот подход предлагает более точные и долгосрочные прогнозы, что может способствовать улучшению решений в сфере климата и водных ресурсов. ## Выводы Ре

Annotation:

This paper explores the automated analysis of palmar features using machine learning techniques. We present a computer vision pipeline that extracts key characteristics from palm images, such as principal line structures, texture, and shape metrics. These features are used to train predictive models on a novel dataset curated from annotated palm images. Our approach moves beyond traditional subjective interpretation by providing a data-driven, quantitative framework for studying the correlations...

ID: 2509.02248v1 cs.CV, I.4.9; I.2.10; J.5

arXiv PDF

📄 AnatoMaskGAN: GNN-Driven Slice Feature Fusion and Noise Augmentation for Medical Semantic Image Synthesis

2025-08-19

Авторы:

Zonglin Wu, Yule Xue, Qianxiang Hu, Yaoyao Feng, Yuqi Ma, Shanxiong Chen

#### Контекст Синтез семантических масок в медицинских изображениях является важной задачей, которая играет ключевую роль в данных для анализа и повышении точности обработки изображений. Несмотря на прогресс в генеративных нейронных сетях (GAN), существующие подходы часто сталкиваются с проблемами, такими как недостаточная спецификация пространственных зависимостей и недостаточная нагрузка на реалистичность изображений. Эти ограничения приводят к ограниченной точности и недостаточному уровню подробности в синтезированных масках. Эти проблемы являются мотивацией для разработки новых методов, которые могут компенсировать эти ограничения и улучшить качество синтеза. #### Метод Мы предлагаем AnatoMaskGAN, многослойный фреймворк, который включает в себя несколько инновационных компонентов. В первую очередь, мы разработали модуль для сильно связанной функции слияния специфичности слоёв на основе графов (GNN), который моделирует пространственные отношения между слоями интегрируя информацию из соседних слоёв. Это позволяет улучшить локальную и глобальную структуру. Далее, мы предложили 3D-стратегию внедрения шума, которая учитывает различные варианты структуры и внедряет в генерируемые изображения шум с разными весами, чтобы увеличить широту моделирования. Наконец, мы внедрили классификатор текстур, который оптимизирует гистограмму и текстурные характеристики в процессе синтеза. Эти компоненты объединены в единое целое, чтобы обеспечить более точный и реалистичный синтез масок. #### Результаты Мы проверили AnatoMaskGAN на двух открытых наборах данных: L2R-OASIS и L2R-Abdomen CT. На L2R-OASIS, наша модель показала PSNR равный 26.50 dB, что является 0.43 dB выше текущего состояния техники. На L2R-Abdomen CT, мы достигли SSIM в размере 0.8602, что является 0.48 процентной единицей выше результатов лучшей модели. Эти результаты показывают, что AnatoMaskGAN превосходит современные подходы в точности воспроизведения и качестве перцепции. Анализ абляции показал, что каждый компонент фреймворка (GNN-функция слияния специфичности слоёв, 3D-шумоввод и текстовый классификатор) вносит значительный вклад в улучшение PSNR, SSIM и LPIPS. #### Значимость AnatoMaskGAN может применяться в различных областях, включая данные для обучения и анализа медицинских изображений. Его преимущество заключается в том, что он предлагает более реалистичные и точные маски, что повышает качество данных для обучения и улучшает точность диагностических процессов. Благодаря инновационной архитектуре и высокому качеству синтеза, AnatoMask

Annotation:

Medical semantic-mask synthesis boosts data augmentation and analysis, yet most GAN-based approaches still produce one-to-one images and lack spatial consistency in complex scans. To address this, we propose AnatoMaskGAN, a novel synthesis framework that embeds slice-related spatial features to precisely aggregate inter-slice contextual dependencies, introduces diverse image-augmentation strategies, and optimizes deep feature learning to improve performance on complex medical images. Specificall...

ID: 2508.11375v1 eess.IV, cs.CV, I.4.9

arXiv PDF

📄 SAM Encoder Breach by Adversarial Simplicial Complex Triggers Downstream Model Failures

2025-08-12

Авторы:

Yi Qin, Rui Wang, Tao Huang, Tong Xiao, Liping Jing

## Контекст Область исследования сосредоточена на возможностях и уязвимостях Segment Anything Model (SAM), новой модели разделения изображений, которая предлагает нулевой шаг обучения для интерактивной сегментации. SAM широко применяется в различных задачах, но, несмотря на ее прорывные возможности, она не освобождается от уязвимостей. Эти уязвимости могут привести к сбоям во многих приложениях, которые основываются на ней. Особенно критична уязвимость SAM при передаче в различных доменах, так как это может повлиять на качество работы вспомогательных моделей, которые зависят от нее. В связи с этим, возникает необходимость в поиске решений, которые могут не только выявить эти уязвимости, но и оценить их распространенность и влияние на различные модели. ## Метод Мы предлагаем Vertex-Refining Simplicial Complex Attack (VeSCA), новую методику для генерации трансфертных адверсарных примеров, ориентированных на SAM. Метод VeSCA основывается на использовании только энкодера SAM для построения общих уязвимых регионов между SAM и доростолей. Основная идея заключается в использовании параметрического симплициального комплекса, который моделирует эти уязвимые области в виде "вершин" (узлов), экспериментируя с их сочетаниями. Для того, чтобы обеспечить эффективность и трансфертность, VeSCA применяет итеративную рефининг-методику для точного определения этих узлов. Дополнительно, мы предлагаем легковесную стратегию переподготовки домена, использующую минимальный объем референсных данных, что позволяет уменьшить различия между доменами. В конце концов, VeSCA строит трансфертные адверсарные примеры, используя случайно сэмплированные комплексы, чтобы обеспечить единообразие результатов и высокую трансфертность. ## Результаты Мы провели исследования на трех классах доростолей и пяти различных доменных датасетах, чтобы оценить эффективность VeSCA. В результате, наш метод показал улучшение производительности на 12.7% в сравнении с состояниями технологий (state-of-the-art) в трех различных категориях моделей. Эксперименты также показали, что VeSCA эффективно генерирует трансфертные примеры, которые могут атаковать различные модели, включая тонкие модели, сборки и другие. Также, наши результаты подчеркивают риски, которые SAM представляет для доростолей, и подтверждают необходимость создания более надежных фундаментальных моделей, которые могут справиться с такими угрозами. ## Значимость Наша работа имеет значимость в нескольких областях. Во-первых, она позволяет выявить и анализировать уязвимости SAM в различных сферах применения, в том числе в задачах распознавания изображений, обработки текста и других. Во-вторы

Annotation:

While the Segment Anything Model (SAM) transforms interactive segmentation with zero-shot abilities, its inherent vulnerabilities present a single-point risk, potentially leading to the failure of numerous downstream applications. Proactively evaluating these transferable vulnerabilities is thus imperative. Prior adversarial attacks on SAM often present limited transferability due to insufficient exploration of common weakness across domains. To address this, we propose Vertex-Refining Simplicia...

ID: 2508.06127v1 cs.CV, I.4.9

arXiv PDF