AdaSwitch: An Adaptive Switching Meta-Algorithm for Learning-Augmented Bounded-Influence Problems

2509.02302v1 cs.LG, math.OC 2025-09-06

Авторы:

Xi Chen, Yuze Chen, Yuan Zhou

Резюме на русском

## Контекст Существуют многопериодные онлайн-задачи с управлением запросами, где решения принимаются без представления о будущих запросах. Эти задачи часто возникают в системах управления складами, мобильной сети, онлайн-аллокации ресурсов и других областях. Условиями задач является то, что решения могут оказывать ограниченное влияние на последующие результаты, что делает их решение сложным. Для улучшения решений в таких задачах могут использоваться машинное обучение, но модели могут немного отклоняться от действительности. Как можно совместить эти модели с онлайн-управлением для получения оптимальных решений? ## Метод Мы предлагаем метод AdaSwitch, который сочетает в себе принципы машинного обучения и онлайн-управления ресурсами. Алгоритм состоит из двух частей: адаптивного выбора стратегии и корректировки решений в зависимости от того, насколько точны прогнозы. Мы разработали критерии для оценки точности прогнозов и регулируем применение информации о запросах. Это позволяет AdaSwitch подстраиваться под ситуации с высокой точностью прогнозов и быть жестким в случае их неточности, гарантируя желаемую производительность. ## Результаты Мы проверили AdaSwitch на нескольких сценариях, включая задачу о к-серверах, отображении запросов в системах с ограниченным влиянием, и онлайн-аллокации ресурсов. Показали, что при точных прогнозах AdaSwitch почти достигает оптимального результата. Если прогнозы неточны, то алгоритм показывает классические гарантии конкурентного отношения. Эти результаты подтверждают гибкость и эффективность AdaSwitch в различных условиях. ## Значимость Наш алгоритм может применяться в различных областях, где необходимо принимать решения в условиях неопределенности и ограниченного влияния. Например, в сфере логистики, мобильных сетей и динамической ценообразования. Он обеспечивает сбалансированный подход к использованию прогнозов, позволяя повысить эффективность в близких к оптимальных решениях при том, чтобы сохранять хорошие гарантии в условиях неточности. Это демонстрирует широкую применимость метода к реальным задачам. ## Выводы Мы представили AdaSwitch, новый метод для решения многопериодных онлайн-задач с ограниченным влиянием. Мы показали, что наш алгоритм может эффективно использовать прогнозы для улучшения решений в условиях высокой точности и сохраняет оптимальную производительность при неточных прогнозах. Будущие исследования будут посвящены расширению применения AdaSwitch к более сложным задачам и уточнению его теоретических подходов.

Abstract

We study a class of multi-period online decision-making problems with sequence-based predictions, which may be generated by machine learning models but whose accuracy is not guaranteed. In each period, the decision-maker observes the realized request and must take an irrevocable action that yields a reward or incurs a cost, without knowledge of future arrivals. We introduce a bounded-influence framework, in which past decisions and requests exert only limited impact on the future optimal reward. Within this framework, we propose the AdaSwitch meta-algorithm, which exploits predictions to attain performance close to the offline benchmark when predictions are accurate, while preserving classical competitive-ratio guarantees under highly inaccurate predictions. Our framework and meta-algorithm apply to diverse settings, including lead-time quotation in processing systems, the $k$-server problem, and online allocation of reusable resources. These applications illustrate the flexibility and broad applicability of our approach to learning-augmented online decision-making.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

AdaSwitch: An Adaptive Switching Meta-Algorithm for Learning-Augmented Bounded-Influence Problems

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Convergence for Discrete Parameter Updates

The Geometry of Intelligence: Deterministic Functional Topology as a Foundation ...

Beyond Scaffold: A Unified Spatio-Temporal Gradient Tracking Method

Risk-Sensitive Q-Learning in Continuous Time with Application to Dynamic Portfol...

ARM-Explainer -- Explaining and improving graph neural network predictions for t...

Навигация