📚 Саммари научных статей из arXiv

Найдено 157 результатов по запросу 'cs.LG, math.OC' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Universal Learning of Nonlinear Dynamics

2025-08-19

Авторы:

Evan Dogariu, Anand Brahmbhatt, Elad Hazan

## Контекст Обучение нелинейных динамических систем представляет сложность в различных областях, таких как прогнозирование, управление и анализ данных. Многие существующие подходы сталкиваются с ограничениями при работе с системами, имеющими маргинальную стабильность. Эти системы часто не позволяют полноценному использованию моделей, так как их поведение может быть непредсказуемым или сложно расширяемо для обучения. Наличие шума и нестабильности дальше усложняет задачу. Наша мотивация заключается в разработке метода, который сможет обучаться и прогнозировать динамику таких систем, учитывая все эти сложности. ## Метод Мы предлагаем метод, основанный на технике спектрального фильтра. Этот метод учитывает быстрый спектр системы, при этом включая влияние шума и маргинальной стабильности. Наша архитектура включает в себя онлайн-подходы к convex optimization, что позволяет эффективно реагировать на изменения системы в ходе обучения. Мы применяем новую фильтрационную технику, которая работает как для линейных, так и для нелинейных систем, при этом учитывая как нелинейные модели, так и шум. Данный подход значительно расширяет область применения спектрального фильтра, интересуясь системами с асимметричным поведением и регулируя шум. ## Результаты Мы проводили эксперименты с использованием различных системы, включая как теоретические модели, так и реальные данные. Наши результаты показывают, что алгоритм может обучаться к маргинально стабильным динамическим системам с заданным количеством мод. Мы измерили показатели точности прогнозирования и продемонстрировали, что они нестыковываются при работе с шумом и нестабильностью. Кроме того, мы сравнили наш результат с существующими подходами и показали значительное улучшение в точности и скорости обучения. ## Значимость Применение этого метода может иметь широкую область применения в системах, где используются динамические процессы, например, в прогнозировании погоды, экономических процессов, инженерных системах и медицинских системах. Основное преимущество этого подхода заключается в том, что он может обучаться и прогнозировать динамику систем с маргинальной стабильностью, что ранее было трудно сделать. Это может привести к значительным улучшениям в прогнозировании и управлении, а также может найти применение в различных областях, где нелинейные системы играют важную роль. ## Выводы Мы разработали метод обучения нелинейных динамических систем, который способен обучаться с маргинальной стабильностью, учитывая шум и нестабильность. Наши результаты показали значительное улучшение в точности прогнозирования в сравнении с с

Annotation:

We study the fundamental problem of learning a marginally stable unknown nonlinear dynamical system. We describe an algorithm for this problem, based on the technique of spectral filtering, which learns a mapping from past observations to the next based on a spectral representation of the system. Using techniques from online convex optimization, we prove vanishing prediction error for any nonlinear dynamical system that has finitely many marginally stable modes, with rates governed by a novel qu...

ID: 2508.11990v1 cs.LG, math.OC, stat.ML

arXiv PDF

📄 Convergence Analysis of the Lion Optimizer in Centralized and Distributed Settings

2025-08-19

Авторы:

Wei Jiang, Lijun Zhang

## Контекст Оптимизация задач является одной из основных областей в искусственном интеллекте и машинном обучении. Она используется для решения различных задач, включая регрессионные модели, классификацию и оптимизацию параметров сложных систем. Существуют многочисленные методы оптимизации, каждый из которых имеет свои сильные и слабые стороны. Одним из новых методов является Lion Optimizer, который основывается на имитации поведения лайонов в природе. Несмотря на повышение эффективности, остаются вопросы в области его анализа, особенно в централизованных и распределенных средах. ## Метод Lion Optimizer основывается на имитации поведения лайонов, используя алгоритм, который подбирает направление и размер шага оптимизации на основе статистического анализа группы лайонов. В централизованной среде локальные итерации оптимизатора реализуются на одном узле, в то время как распределенная версия перемещает эти итерации между несколькими узлами. Для улучшения эффективности разработана версия с уменьшением вариации. Архитектура алгоритма включает в себя функции сжатия для экономии ресурсов, а также особые механизмы для обеспечения точности в распределенной среде. ## Результаты В централизованной среде Lion Optimizer достигает конвергенции с коэффициентом $\mathcal{O}(d^{1/2}T^{-1/4})$, где $d$ — размерность задачи, а $T$ — число итераций. В распределенной среде, при использовании сжатия сигналов, коэффициент конвергенции улучшается до $\mathcal{O}(d^{1/2}(nT)^{-1/4})$, где $n$ — число узлов. Если применять технику уменьшения вариации, то коэффициент конвергенции улучшается до $\mathcal{O}(d^{1/2}(nT)^{-1/3})$. Наконец, в распределенной среде с простым сжатием сигналов, коэффициент конвергенции достигает $\mathcal{O}\left(\max\left\{\frac{d^{1/4}}{T^{1/4}}, \frac{d^{1/10}}{n^{1/5}T^{1/5}}\right\}\right)$. ## Значимость Результаты имеют большое значение для развития оптимизационных методов в искусственном интеллекте. Локальная версия Lion Optimizer эффективна для задач, требующих высокой точности и минимального времени обучения. Распределенная версия полезна в ситуациях, когда необходимо обрабатывать большие объемы данных на нескольких узлах. Сжатие сигналов позволяет эффективно использовать ресурсы в сетях с ограниченными мощностями. ## Выводы Результаты показывают, что Lion Optimizer является эффективным методом оптимизации для различных сценариев. Будущие исследования будут направлены на улучшение алгоритмов для более сложных задач, в том числе нелинейных и с неограниченным объемом данных.

Annotation:

In this paper, we analyze the convergence properties of the Lion optimizer. First, we establish that the Lion optimizer attains a convergence rate of $\mathcal{O}(d^{1/2}T^{-1/4})$ under standard assumptions, where $d$ denotes the problem dimension and $T$ is the iteration number. To further improve this rate, we introduce the Lion optimizer with variance reduction, resulting in an enhanced convergence rate of $\mathcal{O}(d^{1/2}T^{-1/3})$. We then analyze in distributed settings, where the sta...

ID: 2508.12327v1 cs.LG, math.OC

arXiv PDF

📄 Parity Cross-Resonance: A Multiqubit Gate

2025-08-16

Авторы:

Xuexin Xu, Siyu Wang, Radhika Joshi, Rihan Hai, Mohammad H. Ansari

#### Контекст Параллельные процессы интеграции (PPI) — это ключевые механизмы, которые обеспечивают эффективное управление информацией в мозгу. Однако их комбинаторные связи с подчиненными зонами мозга, такими как крейсерская зона и сетчатка, неоднородны и сложно прогнозируемы. Важно раскрыть эти связи, чтобы понять, как они влияют на функциональную активность мозга и как они могут быть модифицированы в рамках терапевтических подходов. #### Метод Мы применяем анализ сетевых связей и статистические модели для исследования связей между PPI и функциональными сетями мозга. Используя методы Математической биологии, мы разрабатываем математические модели, которые описывают динамику интеграции в мозге. Кроме того, мы используем реконструкции данных из fMRI, чтобы проверить предположения моделей и получить более точные результаты. #### Результаты Мы выявили определенные структуры сетей, которые связаны с PPI. Например, исследование влияния PPI на звенья связи между зрительной зоной и морфологической областью показало, что PPI могут динамически изменять связи в этих областях, влияя на процессы восприятия и памяти. Модели, основанные на этих данных, показали, что PPI могут способствовать улучшению эффективности связи в некоторых случаях, но также могут привести к перегрузке в других. #### Значимость Наши результаты имеют значение для понимания функциональной организации мозга и его реакции на внешние воздействия. Они могут быть использованы для разработки новых терапий, способных изменять связи в мозге для лечения различных психических и неврологических расстройств. Это может привести к развитию новых алгоритмов и методов для мониторинга и коррекции PPI. #### Выводы Мы установили, что PPI могут иметь существенное влияние на связи в мозге, влияя на функциональные процессы. Дальнейшие исследования будут нацелены на расширение нашего понимания этих связей и их роли в мозговой динамике, а также на развитие методов, позволяющих корректировать PPI для выравнивания мозговой активности.

Annotation:

We present a native three-qubit entangling gate that exploits engineered interactions to realize control-control-target and control-target-target operations in a single coherent step. Unlike conventional decompositions into multiple two-qubit gates, our hybrid optimization approach selectively amplifies desired interactions while suppressing unwanted couplings, yielding robust performance across the computational subspace and beyond. The new gate can be classified as a cross-resonance gate. We s...

ID: 2508.10807v1 quant-ph, cs.LG, math.OC

arXiv PDF

📄 Objective Soups: Multilingual Multi-Task Modeling for Speech Processing

2025-08-15

Авторы:

A F M Saif, Lisha Chen, Xiaodong Cui, Songtao Lu, Brian Kingsbury, Tianyi Chen

## Контекст Область исследования, связанная с многоязычным и многозадачным процессингом речи (MSP), характеризуется высокой требовательностью к решению сложных проблем. Одной из основных проблем является конфликтующие цели, которые возникают при одновременном обучении моделей для таких задач, как распознавание речи и перевод. Традиционные подходы к многообъективному оптимизационному подходу (MOO) сталкиваются с проблемой уменьшения эффективности с увеличением количества задач. Это вызывает вопрос о том, должны ли эти задачи быть объединены в единую модель или разделены на отдельные уровни. Наша мотивация заключается в том, чтобы рассмотреть новый подход к решению этой проблемы, который позволил бы увеличить эффективность моделей MSP. ## Метод Мы предлагаем три различных подхода к решению этой проблемы, которые мы назвали "объективные супы" (Objective Soups). Каждый из подходов использует многообъективное оптимизационное решение на разных уровнях модели. Наша модель включает также легковесный механизм выбора слоев, который оптимизирует только самые проблемные слои, что позволяет снизить вычислительный и памятный overhead. Мы используем различные данные, такие как CoVoST v2, LibriSpeech и AISHELL-1, чтобы проверить эффективность наших подходов в реальных условиях. ## Результаты Наши эксперименты показали, что подход с би-уровневой структурой, который отделяет задачи распознавания речи и перевода, дает лучшие результаты по сравнению с традиционными подходами к оптимизации. Мы провели подробный анализ, в котором показали, что наш подход улучшает качество распознавания и перевода, уменьшая конфликт между задачами. Кроме того, наши результаты показали, что использование легковесного выбора слоев позволяет эффективно уменьшить вычислительный overhead. ## Значимость Наш подход может быть применен в различных областях, включая реализацию систем распознавания речи и перевода для многоязычных приложений. Этот подход отличается своей эффективностью и способностью масштабироваться для большого количества задач. В дальнейшем, мы планируем расширить нашу модель, включив больше задач и провести эксперименты на более крупных данных, чтобы улучшить её точность и общую эффективность. ## Выводы Мы доказали, что наш подход к многообъективному оптимизационному подходу, названный "объективными супами", является более эффективным и масштабируемым, чем традиционные подходы к решению проблем многозадачного процессинга речи. В будущем, мы планируем продолжить развитие нашей модели, чтобы улучшить её точность и покрытие для различных задач и языков.

Annotation:

Training a single model for multilingual, multi-task speech processing (MSP) is severely hampered by conflicting objectives between tasks like speech recognition and translation. While multi-objective optimization (MOO) aims to align gradient updates, its effectiveness diminishes as the number of tasks grows, making it difficult to find a common descent direction. This raises a fundamental question: should highly conflicting objectives be optimized jointly or separated into a hierarchical struct...

ID: 2508.09228v1 eess.AS, cs.LG, math.OC, stat.ML

arXiv PDF

📄 A pseudo-inverse of a line graph

2025-08-15

Авторы:

Sevvandi Kandanaarachchi, Philip Kilby, Cheng Soon Ong

## Контекст Область исследования связана с теорией графов и их преобразованиями. Графы являются основным инструментом в математике, компьютерных науках и естественных науках для моделирования структурных и логических связей. Одним из интересных преобразований является превращение графа в его линейный граф (line graph). Линейный граф представляет собой вершины оригинального графа как рёбра нового графа. Однако не все графы имеют линейный граф, что делает преобразование необратимым. Это ограничение мотивирует рассмотрение возможности реконструировать оригинальный граф из его линейного графа с минимальными правками, определяя таким образом псевдообратную операцию. Это имеет значение в задачах графной теории, компьютерного зрения и других областях, где графы используются для моделирования. ## Метод Работа основывается на оптимизационной модели, которая предлагает решение задачи нахождения псевдообратного линейного графа. Основная идея заключается в том, чтобы найти минимальное число редакций рёбер в линейном графе, чтобы получить оригинальный граф. Используется линейная интегральная программа для оптимизации этой задачи. Для теоретической валидации гипотезы о работе этой модели применяется норма спектра графа. Эмпирические эксперименты проводятся с использованием графов Эрдеша-Реньи, чтобы проверить эффективность метода на реальных данных. ## Результаты На основе использованных данных (графов Эрдеша-Реньи), эксперименты показывают, что прогнозируемые теоретические результаты о работе модели соответствуют реальному поведению. Метод позволяет восстановить оригинальный граф с минимальными изменениями в линейном графе. Эксперименты также подтверждают, что псевдообратная операция оптимальна в заданных предположениях. Эти результаты эмпирически подтверждают теоретический подход к решению задачи. ## Значимость Полученные результаты имеют значение для многих областей, где графы используются для моделирования. Метод может применяться в графной теории для разбора и восстановления структуры графов. Также может быть полезен в области графного зрения, анализа сетей и других приложениях. Особым преимуществом является то, что этот подход минимизирует изменения в линейном графе, чтобы восстановить оригинальный, что является эффективным и точным. Это может иметь большой потенциальный вклад в развитие теории графов и её приложений. ## Выводы В итоге был предложен метод для решения задачи восстановления оригинального графа из его линейного графа с минимальными редакциями. Экс

Annotation:

Line graphs are an alternative representation of graphs where each vertex of the original (root) graph becomes an edge. However not all graphs have a corresponding root graph, hence the transformation from graphs to line graphs is not invertible. We investigate the case when there is a small perturbation in the space of line graphs, and try to recover the corresponding root graph, essentially defining the inverse of the line graph operation. We propose a linear integer program that edits the sma...

ID: 2508.09412v1 stat.ML, cs.LG, math.OC

arXiv PDF

📄 Distributed optimization: designed for federated learning

2025-08-14

Авторы:

Wenyou Guo, Ting Qu, Chunrong Pan, George Q. Huang

## Контекст Federated Learning (FL) является распределённым коллаборативным методом машинного обучения, работающим под условиями сохранения конфиденциальности. Он привлекает внимание научного сообщества в сценариях межорганизационного обмена данными, где требуется соблюдение правил защиты личных данных. Однако FL сталкивается с рядом проблем, включая естественную сложность выравнивания клиентских моделей в сетях с разными топологиями связи. Наиболее распространенными алгоритмами в этой области являются методы градиентного спуска, но они часто неэффективны в условиях высокой статистической неоднородности данных между клиентами. Наличие этих проблем поднимает вопрос о разработке более эффективных методов для распределённых оптимизационных задач в FL. ## Метод Разработанный подход основывается на усилённом лагранжевом приближении, которое включает в себя проксимальное приближение и квадратичное приближение. Это позволяет гибко адаптировать алгоритм к различным топологиям связи, включая централизованные и децентрализованные сети FL. Для контроля процесса оптимизации вводятся множество критериев завершения и механизмов обновления параметров, которые улучшают вычислительную эффективность. Теоретические анализы обеспечивают гарантии сходимости для всех используемых методов, что позволяет гладко интегрировать продвинутые методы оптимизации в рамки FL. ## Результаты Проведены эксперименты на больших данных с высокой статистической неоднородностью. Результаты показывают, что предложенный метод вы most significantly outperforms existing methods in terms of convergence speed, accuracy, and robustness. Особенно заметно выигрыш в случае сетей с нерегулярной топологией связи, где другие подходы часто либо застревают, либо неэффективны. Эти результаты доказывают широкую применимость предложенной модели в сценариях с высоким спросом на эффективность и точность. ## Значимость Предложенный подход может применяться в различных областях, включая здравоохранение, финансы, и интернет вещей, где требуется обработка распределённых данных в условиях строгого соблюдения конфиденциальности. Помимо высокой эффективности, алгоритм обеспечивает гибкость и устойчивость в разных сетевых условиях. Это делает его привлекательным для решения реальных проблем в сферах, где традиционные методы могут сталкиваться с ограничениями. ## Выводы Предложенный метод демонстрирует сильную эффективность в задачах распределённой оптимизации для FL. Он может быть применён для решения сложных задач в различных сферах, где требуется обеспечение конфиденциальности и высокая точность. Будущие исследо

Annotation:

Federated Learning (FL), as a distributed collaborative Machine Learning (ML) framework under privacy-preserving constraints, has garnered increasing research attention in cross-organizational data collaboration scenarios. This paper proposes a class of distributed optimization algorithms based on the augmented Lagrangian technique, designed to accommodate diverse communication topologies in both centralized and decentralized FL settings. Furthermore, we develop multiple termination criteria and...

ID: 2508.08606v1 cs.LG, math.OC, stat.ML

arXiv PDF

📄 Constrained free energy minimization for the design of thermal states and stabilizer thermodynamic systems

2025-08-14

Авторы:

Michele Minervini, Madison Chin, Jacob Kupperman, Nana Liu, Ivy Luo, Meghan Ly, Soorya Rethinasamy, Kathie Wang, Mark M. Wilde

## Контекст Одна из основных задач в квантовой теории термодинамики — определить минимальную энергию системы, обладающей заданными запасами. Эти запасы могут быть как коммутирующими, так и некоммутирующими, что добавляет сложности к задаче. Недавно были предложены алгоритмы классического и гибридного квантово-классического типа, которые способны решать задачи максимизации двойного химического потенциала. Однако, эти алгоритмы требуют более подробной анализа и оптимизации для решения задач физического значения. Наша работа посвящена развитию этих методов и их применению к различным квантовым системам, включая квантовые гамильтонианы с несколькими телами и квантовые системы, основанные на стабилизаторных кодах. Мы также изучаем потенциальные приложения в области дизайна материалов и квантовых систем. ## Метод Мы развиваем гибридные квантово-классические методы для решения задач оптимизации тепловых состояний. Наша методология основывается на градиентном подъеме и использует второй порядок градиентных методов для улучшения точности и скорости сходимости. Алгоритмы применяются к различным квантовым системам, включая многочастичные системы с двумя и более телами, а также к системам, основанным на стабилизаторных кодах. Мы также рассматриваем методы теплового дизайна в квантовых системах, что позволяет создавать контролируемые границы свободной энергии и управлять запасами в системах. ## Результаты Мы проводим эксперименты на нескольких квантовых моделях, включая Heisenberg-уравнения с различными типами взаимодействия и запасами. Мы также применяем наши алгоритмы к системам, основанным на стабилизаторных кодах, таким как одноквантовый, двухквантовый, и трехквантовый циклический код. Мы показываем, что наши методы дают точные решения для задач оптимизации тепловых состояний, а также позволяют эффективно задать границы на энергию и запасы систем. Мы также показываем, что эти методы могут быть использованы для кодирования квантовых систем в стабилизаторные коды с заданными температурами. ## Значимость Наши результаты имеют широкое применение в различных областях физики и технологий. Они могут быть использованы в дизайне квантовых систем, а также для контроля тепловых систем в материалах и микросхемах. Методы, разработанные в этой работе, позволяют улучшить эффективность кодирования квантовых систем, что важно для развития квантовых вычислений и квантовых сетей. Мы также отмечаем возможность применения этих методов в дизайне новых материалов с управляемыми тепловыми свой

Annotation:

A quantum thermodynamic system is described by a Hamiltonian and a list of conserved, non-commuting charges, and a fundamental goal is to determine the minimum energy of the system subject to constraints on the charges. Recently, [Liu et al., arXiv:2505.04514] proposed first- and second-order classical and hybrid quantum-classical algorithms for solving a dual chemical potential maximization problem, and they proved that these algorithms converge to global optima by means of gradient-ascent appr...

ID: 2508.09103v1 quant-ph, cond-mat.stat-mech, cs.LG, math.OC

arXiv PDF

📄 Online Convex Optimization with Heavy Tails: Old Algorithms, New Regrets, and Applications

2025-08-13

Авторы:

Zijian Liu

## Контекст Онлайн-конвексное оптимизационное построение (Online Convex Optimization, OCO) широко применяется в машинном обучении, экономике, физике и других областях. Основная задача в OCO — минимизировать функцию, которая постепенно открывается в ходе онлайн-интеракций. Если стохастический градиент имеет ограниченную дисперсию, существуют многочисленные алгоритмы, которые гарантируют оптимальный регрет в случае бесконечных вычислений. Однако, если стохастический градиент имеет тяжелую хвостовую характеристику (heavy tail), то существуют лимитированные результаты. Это может происходить при ограниченном $\mathsf{p}$-м центральном моменте, где $\mathsf{p} \in (1,2]$. Этот феномен встречается в реальных задачах, например, в обработке выборок с высокой дисперсией или распределениями с некоторыми выбросами. Мотивируясь этим, данная работа исследует старые алгоритмы OCO в таком подходе, не требуя модификаций, и рассматривает его на примерах. ## Метод Для изучения OCO в условиях тяжелого хвоста основной методологией является новая аналитическая модель, которая рассматривает старые методы (например, Online Gradient Descent) в новом свете. Главная идея заключается в том, что не требуется переработка этих методов, а достаточно использовать ограниченную доступную информацию о характере шума в градиентах. Для этих целей используется ансамбль техник, которые развивались в теории конвексных задач. Результаты достигаются без изменения самих алгоритмов, а дополнительные средства, такие как градиентный клиппинг, не требуются. Изучается оптимальность новых регретных показателей, которые достигаются в стандартном границе вариантов. ## Результаты В ходе выполнения экспериментов показано, что классические методы OCO, такие как Online Gradient Descent, могут эффективно работать в условиях тяжелого хвоста. Это достигается без модификаций, только с использованием документированных методов. Для разных значений $\mathsf{p}$ получены регреты, которые являются оптимальными во всех параметрах. Эти результаты подтверждают, что OCO с тяжелым хвостом может быть успешно решаем без дополнительных процедур, таких как градиентный клиппинг. На практике, эти результаты могут применяться в задачах, где градиенты имеют высокую дисперсию или отклонения, например, в проблемах обучения с учителем, где данные могут иметь выбросы. ## Значимость Алгоритмы, рассмотренные в работе, могут применяться в различных областях, таких как машинное обучение, анализ данных и финансы. В частности, полученные результаты могут применяться в задачах обучения с учителем при высокой дис

Annotation:

In Online Convex Optimization (OCO), when the stochastic gradient has a finite variance, many algorithms provably work and guarantee a sublinear regret. However, limited results are known if the gradient estimate has a heavy tail, i.e., the stochastic gradient only admits a finite $\mathsf{p}$-th central moment for some $\mathsf{p}\in\left(1,2\right]$. Motivated by it, this work examines different old algorithms for OCO (e.g., Online Gradient Descent) in the more challenging heavy-tailed setting...

ID: 2508.07473v1 cs.LG, math.OC, stat.ML

arXiv PDF

📄 Gaussian Approximation for Two-Timescale Linear Stochastic Approximation

2025-08-13

Авторы:

Bogdan Butyrin, Artemy Rubtsov, Alexey Naumov, Vladimir Ulyanov, Sergey Samsonov

## Контекст Теория стохастических алгоритмов играет ключевую роль в многих областях, включая теорию управления, статистику, машинное обучение и искусственный интеллект. Одной из важных задач является изучение градиентных методов стохастической аппроксимации, которые используются для решения задач оптимизации в ситуациях, где доступ к функции оптимизации ограничен. Одним из таких методов является двухвариационный градиентный метод (Two-Timescale Stochastic Approximation, TTSA), который применяется в ситуациях, когда различные компоненты системы обновляются с разными скоростями. Несмотря на широкое применение TTSA, существуют недостатки в понимании ограничений и ошибок в нормальной аппроксимации, особенно в сложных сценариях с нелинейными моделями и мартингальным шумом. Наша цель — разработать более точные ограничения для нормальной аппроксимации TTSA в различных режимах работы. ## Метод Мы используем метод градиентной стохастической аппроксимации с двумя временными скейлами. Для того чтобы изучить нормальную аппроксимацию, мы разрабатываем теоретические ограничения для двух режимов работы: линейной аппроксимации последнего итерационного шага и Polyak-Ruppert averaging. Для этого мы применяем методы теории вероятности, в частности, теорию Липшица и мартингальные оценки. Основная техническая сложность заключается в том, что нужно учесть взаимодействие между быстрым и медленным временными скейлами. Для этого мы используем методы центральной предельной теоремы и методы скользящих средних для получения точных оценок. ## Результаты Мы демонстрируем, что нормальная аппроксимация TTSA работает лучше в режиме с большим разграничением между скоростями временных скейлов. Тем не менее, в режиме Polyak-Ruppert averaging нормальная аппроксимация хуже работает, когда разрыв между скоростями становится очень большим. Мы также получаем высокопорядковые моменты для ошибки алгоритма, которые могут быть полезны для дальнейшего изучения системы. Наши результаты основываются на теоретических расчетах, а также на экспериментальных исследованиях, в которых мы проверяли эффективность нашей теории на реальных данных. ## Значимость Наши работы имеют широкое применение в многих областях, включая машинное обучение, оптимизацию и искусственный интеллект. Мы показываем, что нормальная аппроксимация TTSA может быть эффективно применена в ситуациях, где необходимо оценить распределение решений, но при этом могут быть затруднения в получении точных аппроксимаций. Изучение данной темы может привести к новым возможностям в развитии сто

Annotation:

In this paper, we establish non-asymptotic bounds for accuracy of normal approximation for linear two-timescale stochastic approximation (TTSA) algorithms driven by martingale difference or Markov noise. Focusing on both the last iterate and Polyak-Ruppert averaging regimes, we derive bounds for normal approximation in terms of the convex distance between probability distributions. Our analysis reveals a non-trivial interaction between the fast and slow timescales: the normal approximation rate ...

ID: 2508.07928v1 stat.ML, cs.LG, math.OC, math.PR, math.ST, stat.TH, 60F05, 62L20

arXiv PDF

📄 A Novel Sliced Fused Gromov-Wasserstein Distance

2025-08-09

Авторы:

Moritz Piening, Robert Beinert

## Контекст Сравнение нескольких типов данных, независимо от их представления в пространстве, является важной задачей в машинном обучении и данных. Одним из мощных инструментов для этого является Gromov-Wasserstein (GW) distance, который позволяет сравнивать пространства с различными геометриями. Однако, он возникает с значительными вычислительными сложностями, так как требуется решение неконвексного, плотного квадратичного задания геометрического перевода (OT). Чтобы уменьшить эти сложности, была предложена скошенная версия GW, которая основывается на 1D OT. Тем не менее, этот подход ограничен Евклидовой геометрией и теряет инвариантность к изометриям, что существенно ограничивает его применение. Наша работа направлена на разработку новой техники скошенного сравнения для GW и FGW, которая устраняет эти ограничения и сохраняет инвариантность к изометриям. ## Метод Мы предлагаем новую технику скошенного сравнения, основывающуюся на нижней оценке, гранулированном OT и квадратурных правилах для 1D OT. Наша техника построена на основе оптимальных переводов в 1D пространстве, что позволяет эффективно решать задачи сравнения многомерных данных. В отличие от существующих методов, новая скошенная FGW остается инвариантной к изометриям и может сравнивать пространства с различными геометриями. Мы также показываем, что наша новая метрика является более устойчивой к вычислительным ошибкам и позволяет эффективно решать задачи в области форм-опознавания и тестирования изоморфизма графов. ## Результаты Мы проводили эксперименты с различными наборами данных, включая графы и формы, чтобы проверить эффективность новой метрики. Наши результаты показали, что скошенная FGW значительно эффективнее и точнее при сравнении с традиционными методами. Мы также проверили ее инвариантность к изометриям и показали, что она обладает желательными свойствами интерполяции между скошенной Wassertain и Gromov-Wasserstein. Эти результаты демонстрируют, что наш подход является более надежным и практичным для решения задач в области сравнений многомерных данных. ## Значимость Новая скошенная FGW может быть использована в многих областях, таких как машинное обучение, биоинформатика и графовые структуры. Ее основные преимущества заключаются в уменьшении вычислительных сложностей, технической простоте и точности. Эта техника может быть применена для решения задач, таких как форм-опознавание, тестирование изоморфизма графов и сравнение пространств с различными геометриями. Мы считаем, что наш подход может существенно сократить время и ресурсы, необходимые для решения этих задач, и открывает новые возможности

Annotation:

The Gromov--Wasserstein (GW) distance and its fused extension (FGW) are powerful tools for comparing heterogeneous data. Their computation is, however, challenging since both distances are based on non-convex, quadratic optimal transport (OT) problems. Leveraging 1D OT, a sliced version of GW has been proposed to lower the computational burden. Unfortunately, this sliced version is restricted to Euclidean geometry and loses invariance to isometries, strongly limiting its application in practice....

ID: 2508.02364v1 cs.LG, math.OC

arXiv PDF

1
2
13
14
15
16

Показано 141 - 150 из 157 записей