📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Mattias Cross, Anton Ragni

## Контекст Повышение качества речи является ключевым заданием в области акустического обработки сигналов. Основной проблемой в данной области является лишняя шумовая компонента, которая затрудняет распознавание речи. Существуют различные методы по повышению качества речи, включая генеративные подходы, такие как векторное сжатие и скользящие окна. Несмотря на достигнутые успехи, эти методы не всегда обеспечивают полное устранение шума или неэффективно работают в условиях низкого качества записи. Таким образом, существует необходимость в разработке более эффективных подходов к повышению качества речи, которые могут обеспечить наилучшую ясность и звуковую чистоту. ## Метод Технология, используемая в данном исследовании, основана на подходе стохастического потока (flow-based generative models), который используется для моделирования распределений в сигнале речи. Используется метод "Скороdingерская труба" (Schrodinger Bridge), который стремится моделировать кривые пути между шумом и чистым сигналом речи. Тем не менее, поиск прямых путей, таких как вариант "Условное стохастическое соответствие" (Conditional Flow Matching), является новым подходом к повышению качества речи. Этот подход сосредоточен на моделировании прямых связей между шумовым и чистым сигналом, что позволяет повысить точность и уменьшить комплексность процесса обучения. ## Результаты В экспериментах использовались специально подготовленные данные речи с разным уровнем шума. Метод Conditional Flow Matching показал значительные улучшения по сравнению с подходом Schrodinger Bridge в различных метриках качества речи, таких как Signal-to-Noise Ratio (SNR) и Perceptual Evaluation of Speech Quality (PESQ). Кроме того, указано, что Conditional Flow Matching не только повышает качество речи, но и уменьшает необходимое время обучения и расчета. Таким образом, полученные результаты подтверждают, что использование условного стохастического соответствия может привести к значительным улучшениям в речевом повышении качества. ## Значимость Полученный подход может быть применен в различных сферах, включая системы распознавания речи, телекоммуникации и медицинские приложения. Одной из основных преимуществ является увеличение точности распознавания речи, что может быть критично в ситуациях, требующих высокого качества аудио. Также, полученный подход может снизить вычислительные затраты и улучшить эффективность обучения моделей. Это может привести к меньшим затратам на ресурсы и более быстром развитии новых технологий в области речи и аудио-процессинга. ## Выводы Результаты исследования показывают, что условное стохастическое соответствие является эффективным методом
Annotation:
Current flow-based generative speech enhancement methods learn curved probability paths which model a mapping between clean and noisy speech. Despite impressive performance, the implications of curved probability paths are unknown. Methods such as Schrodinger bridges focus on curved paths, where time-dependent gradients and variance do not promote straight paths. Findings in machine learning research suggest that straight paths, such as conditional flow matching, are easier to train and offer be...
ID: 2508.20584v1 cs.SD, cs.AI, cs.LG
Авторы:

Fachri Najm Noer Kartiman, Rasim, Yaya Wihardi, Nurul Hasanah, Oskar Natan, Bambang Wahono, Taufik Ibnu Salim

## Контекст Исследование автономного управления транспортными средствами занимает важное место в росте технологий пробега. Увеличение числа автомобилей и транспортных средств приводит к усложнению проблем с дорожной безопасностью. Существующие системы управления автоматическим вождением опираются на методы, основывающиеся на простых функциях. Из-за этого они могут недостаточно эффективно реагировать на сложные обстановки на дороге, такие как адверсарные сценарии. Это подчеркивает необходимость развития более точных моделей, которые могут предсказать маршрут и осуществить навигацию в таких условиях. ## Метод Разработанная модель, SKGE-Swin, является единой архитектурой, основанной на Swin Transformer с применением skip connection mechanism. Данная архитектура использует Shifted Window-based Multi-head Self-Attention (SW-MSA) для достижения глобального контекста и обеспечения возможности углубленного понимания данных. Механизм skip connection позволяет сохранять ключевую информацию с начала до конца процесса извлечения признаков, что улучшает способность модели решать задачи в трудных сценариях. ## Результаты Эксперименты проводились на платформе CARLA с использованием адверсарных сценариев для того, чтобы подтвердить реалистичность. Модель SKGE-Swin показала высокую эффективность, установив новую рекордную метрику Driving Score. Абляционное исследование показало, что как skip connections, так и Swin Transformer сильно влияют на улучшение модели. Эти результаты не только подтверждают эффективность SKGE-Swin, но и указывают на сильное влияние каждой компоненты архитектуры. ## Значимость Предложенная модель имеет широкое применение в автономном транспорте, системах безопасности дорог и прогнозировании дорожного движения. Её преимущества включают улучшенную способность решать задачи в сложных сценариях, высокую скорость обучения и гладкую интеграцию с имеющимися системами. Это может способствовать улучшению безопасности на дорогах и эффективности транспортных процессов. ## Выводы Разработанная модель SKGE-Swin доказала высокую эффективность в автономном управлении транспортными средствами. Будущие исследования будут направлены на улучшение скорости обучения модели и расширение применений в различных сферах, в том числе и в мобильном транспорте и логистике.
Annotation:
Focusing on the development of an end-to-end autonomous vehicle model with pixel-to-pixel context awareness, this research proposes the SKGE-Swin architecture. This architecture utilizes the Swin Transformer with a skip-stage mechanism to broaden feature representation globally and at various network levels. This approach enables the model to extract information from distant pixels by leveraging the Swin Transformer's Shifted Window-based Multi-head Self-Attention (SW-MSA) mechanism and to retai...
ID: 2508.20762v1 cs.CV, cs.AI, cs.LG, cs.RO
Авторы:

Harethah Abu Shairah, Hasan Abed Al Kader Hammoud, George Turkiyyah, Bernard Ghanem

#### Контекст Large Language Models (LLMs) широко используются для решения различных задач, но сталкиваются с проблемами безопасности и цензуры. Некоторые запросы могут привести к нежелательным или повредным результатам. Для устранения этой проблемы разработаны системы «безопасности ввода-вывода» (e.g., Llama Guard 3), которые отклоняют вводные запросы с потенциально неблагоприятными результатами. Однако в существующих системах обнаруживаются слабые места: некоторые вводные данные могут обходить эти механизмы, изменяя внутренние представления модели. Наша мотивация заключается в разработке эффективного, простого и недорогого метода для усиления безопасности LLMs. #### Метод Мы предлагаем Rank-One Safety Injection (ROSI), метод, основанный на тонкой настройке, который повышает безопасность LLMs. ROSI работает путем перманентного управления активациями модели, направляя их в направление, отвергающее нежелательные запросы. Это достигается за счет однорангового модификатора весов, применяемого ко всем матрицам записи резидентных потоков. Для вычисления безопасного направления требуется малая выборка синтетических инструкций, обозначающих границы безопасности. ROSI легко интегрируется в существующие модели без требуемых для тонкой настройки ресурсов. #### Результаты Мы провели эксперименты на модели Llama Guard 3, оценивая расходимость безопасности перед и после применения ROSI. Наши результаты показали, что ROSI повышает безопасность, существенно увеличивая отказы в обработке неблагоприятных запросов. Измерения показали, что улучшения безопасности не приводят к ухудшению производительности на стандартных тестовых наборах (MMLU, HellaSwag, Arc). Мы также проверили, насколько эффективен ROSI при усилении безопасности «неограниченных» моделей, результаты показали, что он может добиваться повышения безопасности, даже в таких случаях. #### Значимость ROSI может применяться в различных сферах, где требуется цензура и безопасность ввода-вывода. Он предлагает простой, недорогой и эффективный способ улучшения безопасности LLMs. Этот подход может быть использован как дополнительный метод в существующих системах безопасности, а также в качестве последнего этапа в цепочке безопасности, где потребуется минимальный ресурсный вклад. #### Выводы Мы доказали, что ROSI является эффективным инструментом для повышения безопасности LLMs, за счет управления внутренними активациями модели. Наша работа показывает, что целевое интерпретируемое управление весами может стать отличным вариантом для улучшения безопасности, даже при ограниченных ресурсах. Будущие исследования б
Annotation:
Safety alignment in Large Language Models (LLMs) often involves mediating internal representations to refuse harmful requests. Recent research has demonstrated that these safety mechanisms can be bypassed by ablating or removing specific representational directions within the model. In this paper, we propose the opposite approach: Rank-One Safety Injection (ROSI), a white-box method that amplifies a model's safety alignment by permanently steering its activations toward the refusal-mediating sub...
ID: 2508.20766v1 cs.CL, cs.AI, cs.LG
Авторы:

Adam Coscia, Shunan Guo, Eunyee Koh, Alex Endert

#### Контекст Применение технологий генерирующих текст в области многократного общения с большими лингвистическими моделями (LLM) позволяет решить многие задачи в области обмена информацией, управления задачами и поиска решений. Однако, при увеличении трудности и продолжительности таких диалогов становится сложнее пользователям отслеживать и контролировать прогресс решения задач. Это может привести к ошибкам, путанице и потере времени. Необходима система, которая помогала бы пользователям отслеживать прогресс и корректировать стратегии общения с моделью. #### Метод На основе библиотеки коммуникации с LLM разработана интерфейсная система OnGoal, которая использует методы глубокого обучения для предоставления реального времени оценок степени соответствия пользовательских задач и решений модели. Интерфейс включает в себя функции, такие как реальное время визуализация прогресса, точные оценки прогресса по целям пользователя, а так же подробные объяснения результатов с примерами из диалога. Данная система также позволяет пользователю отслеживать изменения в стратегии общения в течение всего диалога. #### Результаты Проведенные эксперименты с 20 участниками показали, что использование OnGoal при построении диалога с LLM существенно сокращает время и усилия, необходимые для достижения целей. Участники, использовавшие OnGoal, демонстрировали более эффективные стратегии общения, такие как уточнение вводных данных и изменение темы диалога для устранения непонятностей. Эти результаты подтверждают, что поддержка целей в диалоге может улучшить эффективность и удовлетворение пользователей. #### Значимость OnGoal может применяться в различных сферах, включая обучение, консультации и управление проектами, где пользователи работают с LLM для достижения конкретных целей. Он уменьшает когнитивный нагрузку пользователей, улучшает взаимодействие и позволяет добиваться более точных результатов. Это может улучшить общую эффективность диалога с моделями и увеличить удовлетворение пользователей. #### Выводы Результаты исследования показали, что OnGoal значительно улучшает работу с LLM в многократных диалогах, помогая пользователям поддерживать прогресс в задачах и стратегии общения. Будущие исследования будут сфокусированы на расширении функционала интерактивности и повышении точности оценок прогресса. Эти направления могут привести к более широкому применению технологий LLM в профессиональных и образовательных сферах.
Annotation:
As multi-turn dialogues with large language models (LLMs) grow longer and more complex, how can users better evaluate and review progress on their conversational goals? We present OnGoal, an LLM chat interface that helps users better manage goal progress. OnGoal provides real-time feedback on goal alignment through LLM-assisted evaluation, explanations for evaluation results with examples, and overviews of goal progression over time, enabling users to navigate complex dialogues more effectively....
ID: 2508.21061v1 cs.HC, cs.AI, cs.LG
Авторы:

Zhan Shi, Yefeng Yuan, Yuhong Liu, Liang Cheng, Yi Fang

## Контекст В настоящее время системы машинного обучения полагаются на большие и высококачественные данные, необходимые для эффективной моделирования и анализа. Однако многие такие данные включают в себя конфиденциальную информацию, которая может повлечь за собой риски для конфиденциальности и потенциальные нарушения законодательства. Ранее использованные методы анонимности часто оказываются недостаточно эффективными, так как не учитывают неявные признаки, такие как стиль письма или топический контекст. Эти неявные признаки могут быть использованы для идентификации исходного автора данных. В этом контексте важно разработать методы, которые не только обеспечат сохранение конфиденциальности, но и сохранят качество данных для применения в моделях машинного обучения. ## Метод Мы предлагаем использовать процедуру гибкой оптимизации на основе алгоритмов глубокого обучения, которая заключается в том, чтобы применять модели глубокого обучения в качестве основы для повышения качества выводимых данных. Мы используем гибкие архитектуры, которые могут обрабатывать различные типы данных и изменяться в зависимости от конкретного задания. Наша модель основывается на подходе, который включает в себя совмещение различных наградных функций для оптимизации критериев качества, среди которых являются семантическая точность, обфускация исходного автора и разнообразие вывода. Мы также используем минимальные значения среднего значения для повышения эффективности процесса. ## Результаты Мы проводим эксперименты на широком диапазоне данных, включая корпусы, содержащие конфиденциальные данные. Наши результаты показывают, что разработанная модель позволяет повысить уровень конфиденциальности данных, сохранив при этом качество и точность вывода. Мы также проводим сравнение с другими методами, показывающими, что наш подход показывает значительное преимущество в обеспечении конфиденциальности без существенного потери качества данных. Также мы проводим анализ изменений в структуре данных, показывающих, что наш подход уместно реагирует на необходимость обфускации стиля и контекста. ## Значимость Наш подход имеет широкие возможноhedenо применения в различных областях, где необходимо обеспечение конфиденциальности данных. Например, он может применяться в медицине, финансах и юридических сферах, где качество и конфиденциальность данных являются критичными. Метод также может использоваться для создания более безопасных систем машинного обучения, уменьшая риск раскрытия конфиденциальной информации. Это может привести к повышению уровня доверия к системам, в которых используются синтетически
Annotation:
The performance of modern machine learning systems depends on access to large, high-quality datasets, often sourced from user-generated content or proprietary, domain-specific corpora. However, these rich datasets inherently contain sensitive personal information, raising significant concerns about privacy, data security, and compliance with regulatory frameworks. While conventional anonymization techniques can remove explicit identifiers, such removal may result in performance drop in downstrea...
ID: 2508.19286v1 cs.CR, cs.AI, cs.LG
Авторы:

Luca Grillotti, Lisa Coiffard, Oscar Pang, Maxence Faldor, Antoine Cully

## Контекст Автоматическое развитие способностей роботов является ключевым заданием для создания универсальных и эффективных систем автономного робототехнического управления. Однако, современные методы требуют вмешательства человека для определения целей и параметров обучения. Такая зависимость от человеческого вмешательства ограничивает робота в своей способности адаптироваться к нестандартным и непредсказуемым ситуациям. Более того, обучение на физической робот-платформе требует крупных объемов данных и жесткого контроля за безопасностью, что затрудняет развитие эффективных методов для обнаружения многообразия возможных робот-ситуаций. Эта статья предлагает расширенный подход к самостоятельному развитию робот-способностей в реальном мире, который уменьшает необходимость вручную настраивать цели и ограничения. ## Метод Мы предлагаем метод, названный Unsupervised Real-World Skill Acquisition (URSA), расширенное расширение существующего Quality-Diversity Actor-Critic (QDAC). URSA объединяет механизм генерации разнообразия с автономным обнаружением робот-способностей в реальном мире, не требуя человеческого вмешательства. У нас есть две основные операции: 1) поиск потенциальных способностей робота в реальном мире с помощью новых техник оптимизации, и 2) поддержка этих способностей с помощью легковесного моделирования, которое позволяет роботу измерять эффективность своих действий. URSA также может работать в тех случаях, когда сбор данных должен быть быстрым и эффективным, чтобы обеспечить безопасность и высокую производительность. ## Результаты Мы провели эксперименты, в которых робот-управляемый Unitree A1 прошел специально сконструированные тесты в симуляции и реальном мире. Мы сравнивали URSA с тремя существующими методами, включая QDAC. Результаты показывают, что URSA не только выполняет достижение разнообразных робот-способностей, но и обеспечивает высокую производительность в обнаружении способностей в реальном мире. Например, URSA удалось выявить более 10 различных робот-способностей на Unitree A1, в том числе стойкость к повреждениям и повышенную локальную мобильность. Кроме того, URSA показал себя эффективнее всех остальных методов в сценариях с различными видами повреждений, из-за того, что он может адаптироваться к новым условиям без требования человеческого вмешательства. ## Значимость Наш метод может быть применен в различных сферах, включая автономное робототехническое управление, организацию производственных задач, а также в области роботов-компаньонов, которые должны самос
Annotation:
Autonomous skill discovery aims to enable robots to acquire diverse behaviors without explicit supervision. Learning such behaviors directly on physical hardware remains challenging due to safety and data efficiency constraints. Existing methods, including Quality-Diversity Actor-Critic (QDAC), require manually defined skill spaces and carefully tuned heuristics, limiting real-world applicability. We propose Unsupervised Real-world Skill Acquisition (URSA), an extension of QDAC that enables robo...
ID: 2508.19172v3 cs.RO, cs.AI, cs.LG
Авторы:

Pilsung Kang

## Контекст Область исследования связана с исследованием фондов квантовых систем, а именно с квантовым суперпозиционированием (парадоксальным явлением, когда частицы могут быть связаны даже при разными местах их нахождения), а также с применением квантовых подходов в машинном обучении. Исторически сложилось, что квантовое суперпозиционирование использовалось в основном для понимания базовых принципов физики, в том числе доказательства теоремы Белла, которая показала, что квантовые системы могут показывать корреляции, которые не могут быть объяснены стандартными локальными теориями реальности. Однако в последнее время становится понятно, что квантовое суперпозиционирование может использоваться не только для теоретических аргументов, но и в практике, в частности, в машинном обучении. Таким образом, мотивация этого исследования заключается в том, чтобы изучить, могут ли квантовые корреляции использоваться для улучшения машинного обучения и как они могут выступать в роли "супер-конфундирующих" факторов, которые могут повлиять на результаты моделей. ## Метод Методология исследования основывается на идее, что квантовое суперпозиционирование может быть представлено как "супер-конфундирующий" фактор, который представляет собой более сильный вид конфундирования по сравнению с классическими случаями. Для этого в работе используется квантовое $\mathcal{DO}$-калькулиус (диаграммно-ориентированный калькулиус), который позволяет рассматривать квантовые системы с точки зрения вывода как причинно-следственных связей. Также в работе вводится понятие "Конфундирующей Силы" (Confounding Strength, CS), которое позволяет измерить уровень конфундирования в системе. Для реализации, использовалась квантовая модель, основанная на квантовых сетях, чтобы увидеть, как квантовое суперпозиционирование влияет на вывод моделей и как оно может быть использовано для улучшения машинного обучения. ## Результаты В результате использования квантового $\mathcal{DO}$-калькулиуса и концепции "Конфундирующей Силы" было показано, что квантовые системы могут показывать более сильное конфундирование по сравнению с классическими системами. Была проведена серия экспериментов, в которых использовались квантовые модели, которые позволяли выделять причинно-следственные связи в данных. Эксперименты показали, что применение квантовых систем может улучшить точность моделей машинного обучения, а именно, модель, использующая квантовый подход, показала значительный рост уровня достоверности (до 11,3%) по сравнению с классическим подходом. Таким образом, квантовая система мо
Annotation:
Bell's theorem reveals a profound conflict between quantum mechanics and local realism, a conflict we reinterpret through the modern lens of causal inference. We propose and computationally validate a framework where quantum entanglement acts as a "super-confounding" resource, generating correlations that violate the classical causal bounds set by Bell's inequalities. This work makes three key contributions: First, we establish a physical hierarchy of confounding (Quantum > Classical) and introd...
ID: 2508.19327v1 quant-ph, cs.AI, cs.LG
Авторы:

Sining Zhoubian, Dan Zhang, Yuxiao Dong, Jie Tang

## Контекст В современном мире, представители искусственного интеллекта становятся всё более важными в различных сферах, от роботов до систем автоматизации. Одной из кллючных задач в области машинного обучения является улучшение абстрактного рассуждения, которое становится все более важной задачей в становлении новых технологий. Одной из таких проблем является то, что существующие методы повышения уровня разума и улучшения логического мышления часто не достаточно эффективны в решении задач, которые требуют высокого уровня сложности. Таким образом, возникает необходимость разработки новых, более эффективных методов улучшения абстрактного рассуждения в искусственном интеллекте. ## Метод Методология, предлагаемая в работе, основывается на использовании усовершенствованного алгоритма GRPO (Reinforcement Learning with Guidance), а также на использовании модели важности вариантов ответов (Value Model, VM). Авторы предлагают оптимизированный GRPO, который увеличивает вознаграждение за правильные ответы, что позволяет улучшить показатели логического рассуждения. Также включена модель важности ответов, которая позволяет принимать решения на основе более точных значений, основываясь на значимости ответов в задаче. Также, авторы предлагают метод валидации на основе Monte Carlo Tree Search (MCTS), который позволяет решать задачи в течение мнгого времени, а также повышает точность решений. ## Результаты В ходе экспериментов были проверены различные модели, включая GRPO, ReST-DPO и PRM-BoN. Результаты показали, что предлагаемая процедура ReST-RL улучшает точность решения задач на бенчмарках, таких как APPS, BigCodeBench и HumanEval. Также было проведено сравнение с другими подходами к валидации, таким как PRM-BoN и ORM-MCTS. Результаты экспериментов показали, что ReST-RL превосходит другие подходы по многим показателям, включая точность и скорость рассуждений. ## Значимость Предлагаемый подход может быть применён в широком круге задач, включая контроль качества текста, развитие логического мышления, а также в области развития новых технологий. Благодаря улучшенному GRPO и модели важности ответов, ReST-RL может повысить эффективность и точность работы искусственного интеллекта. Эти достижения могут быть использованы в различных областях, от разработки новых систем взаимодействия с пользователем до улучшения компьютерных технологий в сфере обработки текста и решения комплексных задач. ## Выводы В итоге, ReST-RL достигает высокой точности решения задач, улучшая абстрактное рассуждение и логическое мышление в системах искусственного интеллекта. Будущие исследования будут сконцентрированы на рас
Annotation:
With respect to improving the reasoning accuracy of LLMs, the representative reinforcement learning (RL) method GRPO faces failure due to insignificant reward variance, while verification methods based on process reward models (PRMs) suffer from difficulties with training data acquisition and verification effectiveness. To tackle these problems, this paper introduces ReST-RL, a unified LLM RL paradigm that significantly improves LLM's code reasoning ability by combining an improved GRPO algorith...
ID: 2508.19576v1 cs.AI, cs.LG
Авторы:

Kenji Fukushima, Syo Kamata

## Контекст Анализ данных, полученных с помощью нейронных сетей, широко распространен в науке и технологиях. Одна из проблем в этой области заключается в том, что нейронные сети могут пропускать или неточно интерпретировать ключевую информацию, включая аномалии в данных. Недостаточная транспарентность моделей нейронных сетей делает сложным выявление таких аномалий. Это порождает потребность в методах, позволяющих эффективно оценивать и диагностировать процесс вывода моделей. Одним из таких подходов является Topological Data Analysis (TDA), который использует методы топологического анализа для извлечения значимых структур из данных. Метод Topological Uncertainty (TU) в этой области является продвинутым способом выявления аномалий, основанным на извлечении топологических свойств из нейронных сетей. ## Метод Topological Uncertainty (TU) основывается на использовании топологического анализа для извлечения информации из тренировочных слоев нейронной сети. Топологический анализ позволяет выделять структуры, независимые от мер дополнительного размера (как расстояния, так и меры топологических свойств). Для построения TU используется тренированная feedforward neural network (FNN), в которой хранится информация в виде внутренних слоёв. Технический подход включает следующие этапы: 1. Обучение FNN на данных, включающих входные данные (например, значения измерений) и выходные данные (например, параметры ЭоС). 2. Извлечение внутренних слоёв FNN, которые содержат топологические свойства данных. 3. Использование методов TDA для расчета Topological Uncertainty, основываясь на топологических свойствах извлеченных из тренировочных данных. 4. Классификация данных на основе cross-TU, который позволяет определить, насколько хорошо модель может характеризовать определенный объект или ситуацию. Наша методика включает эксперименты с данными, связанными с нейтронными звездами, используемыми для вывода ЭоС (экивалентная теория состояния). ## Результаты Экспериментально установлено, что подход TU эффективен для выявления аномалий в нейронных сетях. Мы сравнивали тренировочные данные с контрольными тестами, используя различные значения hiperparameterov. Результаты показали, что TU может обнаруживать несоответствия информации, которые могут быть пропущены другими методами. В частности, для подмножества данных с меткой $k=1$ (неудачные интерпретации), TU вы most значительно меньше, чем при $k=0$ (успешные интерпретации). Измеренная точность обнаружения аномалий превышала 90% в лучшем случае, при чётком выборе FNN-параметров. ## Значимость Метод TU имеет широкое применение в области нейронных сетей, в частности, для обнаружения аномали
Annotation:
We study the performance of the Topological Uncertainty (TU) constructed with a trained feedforward neural network (FNN) for Anomaly Detection. Generally, meaningful information can be stored in the hidden layers of the trained FNN, and the TU implementation is one tractable recipe to extract buried information by means of the Topological Data Analysis. We explicate the concept of the TU and the numerical procedures. Then, for a concrete demonstration of the performance test, we employ the Neutr...
ID: 2508.19683v1 nucl-th, cs.AI, cs.LG
Авторы:

Viktor Valadi, Mattias Åkesson, Johan Östman, Salman Toor, Andreas Hellander

## Контекст Federated learning (FL) — это метод обучения моделей с помощью распределенных данных, где клиенты обучают модель локально и делят градиенты с сервером. Однако этот процесс подвержен атакам "gradient inversion", которые могут раскрыть информацию о локальных данных клиентов. Несмотря на появление многих исследований в этой области, остаются вопросы относительно реальности этих атак в условиях реального применения FL. Например, большинство работ ориентированы на уязвимости моделей в режиме инференса, где отключены узколочесткие механизмы, такие как dropout и batch normalization с динамическими статистиками. Наше исследование ориентировано на понимание, как архитектура и тип рабочего режима FL влияют на возможность этих атак в более реалистичных условиях. ## Метод Мы проводим систематический анализ уязвимости федеративных моделей в различных условиях обучения. Для этого используются различные модели, включая глубокие нейросети для классификации изображений и продвинутые модели для обнаружения объектов. Мы используем два основных подхода: атаки с градиентами в режиме инференса (где условия сильно упрощены) и атаки в режиме обучения с учетом реальных условий. Наша методология включает разработку двух новых атак, оптимизированных для различных уровней знаний у атакующего, и подробный эксперимент на модели детектирования объектов в реальном применении. ## Результаты Мы показали, что успешные атаки возможны только при сочетании нескольких условий в архитектуре моделей, включая их ширину, наличие skip-связей и применение pre-activation normalization. Кроме того, мы проверили эффективность нашего атакующего подхода на реальной модели детектирования объектов, где удалось получить успешный градиентный инверсионный атаку только при указанных условиях. Однако, при использовании реальных условий, обнаружено, что сильно ухудшается эффективность таких атак. ## Значимость Наши результаты имеют практическое значение для оценки риска атак в FL. Мы показали, что некоторые архитектурные решения могут значительно усиливать или слабеить уязвимость моделей к таким атакам. Эти находки полезны для разработчиков, помогая им понять, когда и как использовать техники, которые могут уменьшить риск вытекающих из FL данных. Это также открывает пути для будущих исследований в области обеспечения приватности в FL. ## Выводы Мы представили первую подробную исследовательскую работу, которая оценивает риск атак "gradient inversion" в различных условиях тренировки и сериализации моделей в FL. Мы доказали, что некоторые архитектурные решения могут сильно увеличивать уязвимость моделей к таким атакам, но в реальных условиях, эти атаки ока
Annotation:
Gradient inversion attacks have garnered attention for their ability to compromise privacy in federated learning. However, many studies consider attacks with the model in inference mode, where training-time behaviors like dropout are disabled and batch normalization relies on fixed statistics. In this work, we systematically analyze how architecture and training behavior affect vulnerability, including the first in-depth study of inference-mode clients, which we show dramatically simplifies inve...
ID: 2508.19819v1 cs.CR, cs.AI, cs.LG
Показано 1391 - 1400 из 1687 записей