AdaSwitch: An Adaptive Switching Meta-Algorithm for Learning-Augmented Bounded-Influence Problems
2509.02302v1
cs.LG, math.OC
2025-09-06
Авторы:
Xi Chen, Yuze Chen, Yuan Zhou
Резюме на русском
## Контекст
Существуют многопериодные онлайн-задачи с управлением запросами, где решения принимаются без представления о будущих запросах. Эти задачи часто возникают в системах управления складами, мобильной сети, онлайн-аллокации ресурсов и других областях. Условиями задач является то, что решения могут оказывать ограниченное влияние на последующие результаты, что делает их решение сложным. Для улучшения решений в таких задачах могут использоваться машинное обучение, но модели могут немного отклоняться от действительности. Как можно совместить эти модели с онлайн-управлением для получения оптимальных решений?
## Метод
Мы предлагаем метод AdaSwitch, который сочетает в себе принципы машинного обучения и онлайн-управления ресурсами. Алгоритм состоит из двух частей: адаптивного выбора стратегии и корректировки решений в зависимости от того, насколько точны прогнозы. Мы разработали критерии для оценки точности прогнозов и регулируем применение информации о запросах. Это позволяет AdaSwitch подстраиваться под ситуации с высокой точностью прогнозов и быть жестким в случае их неточности, гарантируя желаемую производительность.
## Результаты
Мы проверили AdaSwitch на нескольких сценариях, включая задачу о к-серверах, отображении запросов в системах с ограниченным влиянием, и онлайн-аллокации ресурсов. Показали, что при точных прогнозах AdaSwitch почти достигает оптимального результата. Если прогнозы неточны, то алгоритм показывает классические гарантии конкурентного отношения. Эти результаты подтверждают гибкость и эффективность AdaSwitch в различных условиях.
## Значимость
Наш алгоритм может применяться в различных областях, где необходимо принимать решения в условиях неопределенности и ограниченного влияния. Например, в сфере логистики, мобильных сетей и динамической ценообразования. Он обеспечивает сбалансированный подход к использованию прогнозов, позволяя повысить эффективность в близких к оптимальных решениях при том, чтобы сохранять хорошие гарантии в условиях неточности. Это демонстрирует широкую применимость метода к реальным задачам.
## Выводы
Мы представили AdaSwitch, новый метод для решения многопериодных онлайн-задач с ограниченным влиянием. Мы показали, что наш алгоритм может эффективно использовать прогнозы для улучшения решений в условиях высокой точности и сохраняет оптимальную производительность при неточных прогнозах. Будущие исследования будут посвящены расширению применения AdaSwitch к более сложным задачам и уточнению его теоретических подходов.
Abstract
We study a class of multi-period online decision-making problems with
sequence-based predictions, which may be generated by machine learning models
but whose accuracy is not guaranteed. In each period, the decision-maker
observes the realized request and must take an irrevocable action that yields a
reward or incurs a cost, without knowledge of future arrivals. We introduce a
bounded-influence framework, in which past decisions and requests exert only
limited impact on the future optimal reward. Within this framework, we propose
the AdaSwitch meta-algorithm, which exploits predictions to attain performance
close to the offline benchmark when predictions are accurate, while preserving
classical competitive-ratio guarantees under highly inaccurate predictions. Our
framework and meta-algorithm apply to diverse settings, including lead-time
quotation in processing systems, the $k$-server problem, and online allocation
of reusable resources. These applications illustrate the flexibility and broad
applicability of our approach to learning-augmented online decision-making.
Ссылки и действия
Дополнительные ресурсы: