A Modular Algorithm for Non-Stationary Online Convex-Concave Optimization

2509.07901v1 cs.LG, math.OC 2025-09-11
Авторы:

Qing-xin Meng, Xia Lei, Jian-wei Liu

Резюме на русском

#### Контекст Проблема онлайн-оптимизации нестационарных бийотных задач (Online Convex-Concave Optimization, OCC) широко распространена в машинном обучении, игоровой теории, экономике и других областях. Она заключается в том, чтобы динамически адаптироваться к изменяющимся условиям, стремясь минимизировать динамический дуалитетный гэп (Dynamic Duality Gap, D-DGap) — критический показатель, оценивающий качество стратегий игроков в взаимодействии с произвольными последовательностями сравнения. Несмотря на развитие методов онлайн-оптимизации, существующие алгоритмы не могут обеспечить оптимальную производительность в стационарных или предсказуемых средах, что становится ключевой мотивацией для развития более эффективных решений. #### Метод Мы предлагаем модульный алгоритм, который состоит из трех основных компонентов: **Адаптивного модуля** (Adaptive Module), **Мультипредикторского агрегатора** (Multi-Predictor Aggregator) и **Интегрированного модуля** (Integration Module). **Адаптивный модуль** анализирует уровень нестационарности и динамически адаптируется к изменениям в среде. **Мультипредикторский агрегатор** выбирает лучший из нескольких вариантов предсказаний, обеспечивая точность стратегии. **Интегрированный модуль** объединяет результаты работы двух предыдущих модулей, обеспечивая оптимальное решение. Этот модульный подход позволяет легко заменять или дополнять модули, что увеличивает гибкость и эффективность решения. #### Результаты Мы проверили наш алгоритм экспериментально, используя различные данные и сценарии. Результаты показали, что он достигает минимаксной оптимальности D-DGap, ограниченной логарифмическим множителем, и обеспечивает D-DGap, возникающую из-за ошибок предсказаний. Эти результаты подтверждают высокую эффективность и адаптивность нашего метода в различных средах, включая стационарные и нестационарные. #### Значимость Наш алгоритм имеет широкое применение в ситуациях, где необходима адаптивная оптимизация в динамических условиях. Он может быть использован в игоровой теории, машинном обучении, экономических моделях и других областях, где нестационарные процессы являются ключевыми. Основные преимущества нашего подхода заключаются в высокой точности, гибкости и возможности интеграции сторонних знаний с помощью модулей. Это открывает пути для будущих исследований в области динамического подхода к онлайн-оптимизации. #### Выводы Мы представили модульный алгоритм для решения проблемы онлайн-оптимизации нестационарных бийотных задач. Наш подход демонстрирует высокую эффективность и адаптивность в различных средах. Будущи

Abstract

This paper investigates the problem of Online Convex-Concave Optimization, which extends Online Convex Optimization to two-player time-varying convex-concave games. The goal is to minimize the dynamic duality gap (D-DGap), a critical performance measure that evaluates players' strategies against arbitrary comparator sequences. Existing algorithms fail to deliver optimal performance, particularly in stationary or predictable environments. To address this, we propose a novel modular algorithm with three core components: an Adaptive Module that dynamically adjusts to varying levels of non-stationarity, a Multi-Predictor Aggregator that identifies the best predictor among multiple candidates, and an Integration Module that effectively combines their strengths. Our algorithm achieves a minimax optimal D-DGap upper bound, up to a logarithmic factor, while also ensuring prediction error-driven D-DGap bounds. The modular design allows for the seamless replacement of components that regulate adaptability to dynamic environments, as well as the incorporation of components that integrate ``side knowledge'' from multiple predictors. Empirical results further demonstrate the effectiveness and adaptability of the proposed method.

Ссылки и действия