📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Evan Dogariu, Anand Brahmbhatt, Elad Hazan

## Контекст Обучение нелинейных динамических систем представляет сложность в различных областях, таких как прогнозирование, управление и анализ данных. Многие существующие подходы сталкиваются с ограничениями при работе с системами, имеющими маргинальную стабильность. Эти системы часто не позволяют полноценному использованию моделей, так как их поведение может быть непредсказуемым или сложно расширяемо для обучения. Наличие шума и нестабильности дальше усложняет задачу. Наша мотивация заключается в разработке метода, который сможет обучаться и прогнозировать динамику таких систем, учитывая все эти сложности. ## Метод Мы предлагаем метод, основанный на технике спектрального фильтра. Этот метод учитывает быстрый спектр системы, при этом включая влияние шума и маргинальной стабильности. Наша архитектура включает в себя онлайн-подходы к convex optimization, что позволяет эффективно реагировать на изменения системы в ходе обучения. Мы применяем новую фильтрационную технику, которая работает как для линейных, так и для нелинейных систем, при этом учитывая как нелинейные модели, так и шум. Данный подход значительно расширяет область применения спектрального фильтра, интересуясь системами с асимметричным поведением и регулируя шум. ## Результаты Мы проводили эксперименты с использованием различных системы, включая как теоретические модели, так и реальные данные. Наши результаты показывают, что алгоритм может обучаться к маргинально стабильным динамическим системам с заданным количеством мод. Мы измерили показатели точности прогнозирования и продемонстрировали, что они нестыковываются при работе с шумом и нестабильностью. Кроме того, мы сравнили наш результат с существующими подходами и показали значительное улучшение в точности и скорости обучения. ## Значимость Применение этого метода может иметь широкую область применения в системах, где используются динамические процессы, например, в прогнозировании погоды, экономических процессов, инженерных системах и медицинских системах. Основное преимущество этого подхода заключается в том, что он может обучаться и прогнозировать динамику систем с маргинальной стабильностью, что ранее было трудно сделать. Это может привести к значительным улучшениям в прогнозировании и управлении, а также может найти применение в различных областях, где нелинейные системы играют важную роль. ## Выводы Мы разработали метод обучения нелинейных динамических систем, который способен обучаться с маргинальной стабильностью, учитывая шум и нестабильность. Наши результаты показали значительное улучшение в точности прогнозирования в сравнении с с
Annotation:
We study the fundamental problem of learning a marginally stable unknown nonlinear dynamical system. We describe an algorithm for this problem, based on the technique of spectral filtering, which learns a mapping from past observations to the next based on a spectral representation of the system. Using techniques from online convex optimization, we prove vanishing prediction error for any nonlinear dynamical system that has finitely many marginally stable modes, with rates governed by a novel qu...
ID: 2508.11990v1 cs.LG, math.OC, stat.ML
Авторы:

A F M Saif, Lisha Chen, Xiaodong Cui, Songtao Lu, Brian Kingsbury, Tianyi Chen

## Контекст Область исследования, связанная с многоязычным и многозадачным процессингом речи (MSP), характеризуется высокой требовательностью к решению сложных проблем. Одной из основных проблем является конфликтующие цели, которые возникают при одновременном обучении моделей для таких задач, как распознавание речи и перевод. Традиционные подходы к многообъективному оптимизационному подходу (MOO) сталкиваются с проблемой уменьшения эффективности с увеличением количества задач. Это вызывает вопрос о том, должны ли эти задачи быть объединены в единую модель или разделены на отдельные уровни. Наша мотивация заключается в том, чтобы рассмотреть новый подход к решению этой проблемы, который позволил бы увеличить эффективность моделей MSP. ## Метод Мы предлагаем три различных подхода к решению этой проблемы, которые мы назвали "объективные супы" (Objective Soups). Каждый из подходов использует многообъективное оптимизационное решение на разных уровнях модели. Наша модель включает также легковесный механизм выбора слоев, который оптимизирует только самые проблемные слои, что позволяет снизить вычислительный и памятный overhead. Мы используем различные данные, такие как CoVoST v2, LibriSpeech и AISHELL-1, чтобы проверить эффективность наших подходов в реальных условиях. ## Результаты Наши эксперименты показали, что подход с би-уровневой структурой, который отделяет задачи распознавания речи и перевода, дает лучшие результаты по сравнению с традиционными подходами к оптимизации. Мы провели подробный анализ, в котором показали, что наш подход улучшает качество распознавания и перевода, уменьшая конфликт между задачами. Кроме того, наши результаты показали, что использование легковесного выбора слоев позволяет эффективно уменьшить вычислительный overhead. ## Значимость Наш подход может быть применен в различных областях, включая реализацию систем распознавания речи и перевода для многоязычных приложений. Этот подход отличается своей эффективностью и способностью масштабироваться для большого количества задач. В дальнейшем, мы планируем расширить нашу модель, включив больше задач и провести эксперименты на более крупных данных, чтобы улучшить её точность и общую эффективность. ## Выводы Мы доказали, что наш подход к многообъективному оптимизационному подходу, названный "объективными супами", является более эффективным и масштабируемым, чем традиционные подходы к решению проблем многозадачного процессинга речи. В будущем, мы планируем продолжить развитие нашей модели, чтобы улучшить её точность и покрытие для различных задач и языков.
Annotation:
Training a single model for multilingual, multi-task speech processing (MSP) is severely hampered by conflicting objectives between tasks like speech recognition and translation. While multi-objective optimization (MOO) aims to align gradient updates, its effectiveness diminishes as the number of tasks grows, making it difficult to find a common descent direction. This raises a fundamental question: should highly conflicting objectives be optimized jointly or separated into a hierarchical struct...
ID: 2508.09228v1 eess.AS, cs.LG, math.OC, stat.ML
Авторы:

Wenyou Guo, Ting Qu, Chunrong Pan, George Q. Huang

## Контекст Federated Learning (FL) является распределённым коллаборативным методом машинного обучения, работающим под условиями сохранения конфиденциальности. Он привлекает внимание научного сообщества в сценариях межорганизационного обмена данными, где требуется соблюдение правил защиты личных данных. Однако FL сталкивается с рядом проблем, включая естественную сложность выравнивания клиентских моделей в сетях с разными топологиями связи. Наиболее распространенными алгоритмами в этой области являются методы градиентного спуска, но они часто неэффективны в условиях высокой статистической неоднородности данных между клиентами. Наличие этих проблем поднимает вопрос о разработке более эффективных методов для распределённых оптимизационных задач в FL. ## Метод Разработанный подход основывается на усилённом лагранжевом приближении, которое включает в себя проксимальное приближение и квадратичное приближение. Это позволяет гибко адаптировать алгоритм к различным топологиям связи, включая централизованные и децентрализованные сети FL. Для контроля процесса оптимизации вводятся множество критериев завершения и механизмов обновления параметров, которые улучшают вычислительную эффективность. Теоретические анализы обеспечивают гарантии сходимости для всех используемых методов, что позволяет гладко интегрировать продвинутые методы оптимизации в рамки FL. ## Результаты Проведены эксперименты на больших данных с высокой статистической неоднородностью. Результаты показывают, что предложенный метод вы most significantly outperforms existing methods in terms of convergence speed, accuracy, and robustness. Особенно заметно выигрыш в случае сетей с нерегулярной топологией связи, где другие подходы часто либо застревают, либо неэффективны. Эти результаты доказывают широкую применимость предложенной модели в сценариях с высоким спросом на эффективность и точность. ## Значимость Предложенный подход может применяться в различных областях, включая здравоохранение, финансы, и интернет вещей, где требуется обработка распределённых данных в условиях строгого соблюдения конфиденциальности. Помимо высокой эффективности, алгоритм обеспечивает гибкость и устойчивость в разных сетевых условиях. Это делает его привлекательным для решения реальных проблем в сферах, где традиционные методы могут сталкиваться с ограничениями. ## Выводы Предложенный метод демонстрирует сильную эффективность в задачах распределённой оптимизации для FL. Он может быть применён для решения сложных задач в различных сферах, где требуется обеспечение конфиденциальности и высокая точность. Будущие исследо
Annotation:
Federated Learning (FL), as a distributed collaborative Machine Learning (ML) framework under privacy-preserving constraints, has garnered increasing research attention in cross-organizational data collaboration scenarios. This paper proposes a class of distributed optimization algorithms based on the augmented Lagrangian technique, designed to accommodate diverse communication topologies in both centralized and decentralized FL settings. Furthermore, we develop multiple termination criteria and...
ID: 2508.08606v1 cs.LG, math.OC, stat.ML
Авторы:

Zijian Liu

## Контекст Онлайн-конвексное оптимизационное построение (Online Convex Optimization, OCO) широко применяется в машинном обучении, экономике, физике и других областях. Основная задача в OCO — минимизировать функцию, которая постепенно открывается в ходе онлайн-интеракций. Если стохастический градиент имеет ограниченную дисперсию, существуют многочисленные алгоритмы, которые гарантируют оптимальный регрет в случае бесконечных вычислений. Однако, если стохастический градиент имеет тяжелую хвостовую характеристику (heavy tail), то существуют лимитированные результаты. Это может происходить при ограниченном $\mathsf{p}$-м центральном моменте, где $\mathsf{p} \in (1,2]$. Этот феномен встречается в реальных задачах, например, в обработке выборок с высокой дисперсией или распределениями с некоторыми выбросами. Мотивируясь этим, данная работа исследует старые алгоритмы OCO в таком подходе, не требуя модификаций, и рассматривает его на примерах. ## Метод Для изучения OCO в условиях тяжелого хвоста основной методологией является новая аналитическая модель, которая рассматривает старые методы (например, Online Gradient Descent) в новом свете. Главная идея заключается в том, что не требуется переработка этих методов, а достаточно использовать ограниченную доступную информацию о характере шума в градиентах. Для этих целей используется ансамбль техник, которые развивались в теории конвексных задач. Результаты достигаются без изменения самих алгоритмов, а дополнительные средства, такие как градиентный клиппинг, не требуются. Изучается оптимальность новых регретных показателей, которые достигаются в стандартном границе вариантов. ## Результаты В ходе выполнения экспериментов показано, что классические методы OCO, такие как Online Gradient Descent, могут эффективно работать в условиях тяжелого хвоста. Это достигается без модификаций, только с использованием документированных методов. Для разных значений $\mathsf{p}$ получены регреты, которые являются оптимальными во всех параметрах. Эти результаты подтверждают, что OCO с тяжелым хвостом может быть успешно решаем без дополнительных процедур, таких как градиентный клиппинг. На практике, эти результаты могут применяться в задачах, где градиенты имеют высокую дисперсию или отклонения, например, в проблемах обучения с учителем, где данные могут иметь выбросы. ## Значимость Алгоритмы, рассмотренные в работе, могут применяться в различных областях, таких как машинное обучение, анализ данных и финансы. В частности, полученные результаты могут применяться в задачах обучения с учителем при высокой дис
Annotation:
In Online Convex Optimization (OCO), when the stochastic gradient has a finite variance, many algorithms provably work and guarantee a sublinear regret. However, limited results are known if the gradient estimate has a heavy tail, i.e., the stochastic gradient only admits a finite $\mathsf{p}$-th central moment for some $\mathsf{p}\in\left(1,2\right]$. Motivated by it, this work examines different old algorithms for OCO (e.g., Online Gradient Descent) in the more challenging heavy-tailed setting...
ID: 2508.07473v1 cs.LG, math.OC, stat.ML
Показано 31 - 34 из 34 записей