📚 Саммари научных статей из arXiv

Найдено 157 результатов по запросу 'cs.LG, math.OC' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Online Learning for Approximately-Convex Functions with Long-term Adversarial Constraints

2025-08-27

Авторы:

Dhruv Sarkar, Samrat Mukhopadhyay, Abhishek Sinha

#### Контекст Область исследования заключается в online learning с долгосрочными бюджетными ограничениями в адверсарском настройке. Это задача, в которой на каждом шагу $t$, школа выбирает действие из конвексийного решения множества, после что адверсар открывает функцию затрат $f_t$ и функцию потребления ресурсов $g_t$. Функции затрат и потребления считаются $\alpha$-приближенно конвексиевыми — широкой категорией, которая обобщает конвексионность и затрагивает многие неконвексионные задачи, такие как DR-субмодулярная оптимизация, Online Vertex Cover и Regularized Phase Retrieval. Цель заключается в создании онлайн-алгоритма, минимизирующего суммарную затрату за продолжительность $T$, при этом приближенно соблюдая долгосрочное ограничение бюджета $B_T$. Задача хорошо моделирует прикладные сценарии, где необходимо принимать решения в условиях неопределенности и ограничений ресурсов. #### Метод Методология основывается на разработке эффективного first-order онлайн-алгоритма, который обеспечивает $O(\sqrt{T})$ $\alpha$-regret в отношении оптимальной фиксированной возможной стратегии. Алгоритм реализуется в двух сценариях: полной информации и бандитной обратной связи. Он использует приближение $\alpha$-конвексиевых функций через линейные аппроксимации, что позволяет эффективно обрабатывать их нестандартные свойства. Для обеспечения бюджетного соблюдения, алгоритм использует стохастическую оценку потребления ресурсов и уточняющие шаги для соблюдения долгосрочных ограничений. Архитектура алгоритма основывается на методах онлайн-консенсуса и градиентного спуска, адаптированных для $\alpha$-конвексионных функций. #### Результаты Эксперименты подтвердили эффективность алгоритма в различных сценариях. На полнотелых данных, алгоритм достиг $O(\sqrt{T})$ $\alpha$-regret, который соответствует наилучшей известной теоретической границе. В сценарии бандитной обратной связи, алгоритм эффективно решает проблему Adversarial Bandits with Knapsacks, улучшив существующие гарантии. Демонстрируется, что результаты хорошо согласуются с нижними оценками, подтверждая точность и силу алгоритма. Данные результаты являются ключевыми для применения в области нестандартных оптимизационных задач, где необходимо сочетать гибкость и эффективность. #### Значимость Полученные результаты имеют широкое применение в задачах, где требуется принятие решений в условиях неопределенности и ограничений ресурсов, например, в доставке под заказ, энергоэффективности и менеджменте ресурсов. Основные преимущества заключаются в улучшенных гарантиях regret и ресурсопотребления по сравн

Annotation:

We study an online learning problem with long-term budget constraints in the adversarial setting. In this problem, at each round $t$, the learner selects an action from a convex decision set, after which the adversary reveals a cost function $f_t$ and a resource consumption function $g_t$. The cost and consumption functions are assumed to be $\alpha$-approximately convex - a broad class that generalizes convexity and encompasses many common non-convex optimization problems, including DR-submodul...

ID: 2508.16992v1 cs.LG, math.OC

arXiv PDF

📄 Stochastic Gradient Descent with Strategic Querying

2025-08-27

Авторы:

Nanfei Jiang, Hoi-To Wai, Mahnoosh Alizadeh

## Контекст Проблема оптимизации, особенно в случае задач с большим количеством переменных, широко распространена в машинном обучении и других областях. Одним из ключевых аспектов этих задач является выбор стратегии сбора градиентов в ходе оптимизации. Для многих методов, таких как SGD (Stochastic Gradient Descent), выбор градиентов, на которые ориентируются алгоритмы, может значительно сказываться на эффективности работы алгоритма. Однако существуют ситуации, когда стратегически выбирать градиенты может привести к существенному повышению производительности в сравнении с простой, например, униформной стратегией. Мотивируя подобный подход и исследуя его возможности, авторы приходят к разработке и анализу различных стратегий оптимизации. ## Метод Авторы рассматривают задачу оптимизации функции, заданной как сумма независимых случайных функций, и исследуют различные стратегии по выбору градиентов для оценки направления уменьшения функционала. Одним из алгоритмов, предложенных в работе, является Oracle Gradient Querying (OGQ), который представляет собой идеальную модель, где выбирается градиент, обеспечивающий максимально вероятный прогресс на каждом шаге. Однако, так как в реальной жизни доступ к градиентам всех пользователей (например, в распределенном сценарии) недоступен, авторы предлагают алгоритм Strategic Gradient Querying (SGQ), который делает один градиентный вызов на каждой итерации и показывает лучшую производительность в сравнении с простой стратегией. ## Результаты Авторы проводят эксперименты с различными функционалами, в том числе такими, что удовлетворяют свойству Polyak-Lojasiewicz, чтобы оценить производительность различных стратегий. Они показывают, что Oracle Gradient Querying не только улучшает производительность в начале оптимизации, но и снижает дисперсию в последней стадии. Тем не менее, его использование требует доступа к градиентам всех пользователей, что не практично. Алгоритм Strategic Gradient Querying, в свою очередь, показывает лучшую производительность в сравнении со стандартным SGD в ходе одной итерации. ## Значимость Результаты этой работы могут быть применимы в различных областях, где высокая эффективность оптимизации критична. Например, в машинном обучении или распределенных системах, где выбор градиентов может существенно влиять на общую эффективность. Особенно полезными являются стратегии, предлагаемые в данной работе, так как они не только улучшают периоды первоначального улучшения, но и снижают дисперсию в конце оптимизации. ## Выводы Авторы показали, что стратегический выбор градиентов может значительно повысить эфф

Annotation:

This paper considers a finite-sum optimization problem under first-order queries and investigates the benefits of strategic querying on stochastic gradient-based methods compared to uniform querying strategy. We first introduce Oracle Gradient Querying (OGQ), an idealized algorithm that selects one user's gradient yielding the largest possible expected improvement (EI) at each step. However, OGQ assumes oracle access to the gradients of all users to make such a selection, which is impractical in...

ID: 2508.17144v1 cs.LG, math.OC

arXiv PDF

📄 Provable Mixed-Noise Learning with Flow-Matching

2025-08-27

Авторы:

Paul Hagemann, Robert Gruhlke, Bernhard Stankewitz, Claudia Schillings, Gabriele Steidl

#### Контекст В данном исследовании рассматриваются смешанные шумы в байесовских задачах обратного уравнения, характеризуемые сложным структурным характером, таких как сумма аддитивных и мультипликативных компонент гауссовского шума. Обычно, методы интерпретации таких задач предполагают знание характеристик шума, что не всегда соответствует реальным условиям, особенно в прикладных задачах физики и химии. В настоящей работе авторы целью делают проектирование новых методов, которые позволят обрабатывать ситуации с неизвестным и разнородным шумом. Используя подходы, основанные на flow-based generative modeling, предлагается разработать инференциальный фреймворк, который бы способствовал моделированию параметров шума и оценке параметров модели. #### Метод Методология построена на формализме Expectation-Maximization (EM), в котором включена новая концепция flow-matching в качестве модели для generative modeling. Основной идеей является использование нейросетевого моделирования в E-шаге, дающее возможность оценивать шум и параметры модели с помощью симуляционно-бесплатных ODE-потоков. При этом в формулировке считается, что множество выборок шума генерируется с помощью стохастического процесса, описываемого параметрами, которые необходимо оценить. Алгоритм построен так, чтобы в краткосрочной траектории обеспечивал интерпретируемую оценку параметров в границах оптимальных моделей. Теоретические результаты включают доказательство того, что в случае бесконечного объема данных, EM-алгоритм сходится к тем правдивым параметрам шума, которые предполагаются в задаче. #### Результаты Проводились эксперименты на синтетических данных, нацеленные на оценку точности оценок шума и параметров модели. Использовались шумы с разнообразными структурными характеристиками, включая смешанные компоненты гауссовского процесса. Результаты показали, что способ, основанный на flow-matching, дает более точные оценки в сравнении с традиционными методами. Были проведены измерения качества интерпретации шума, что демонстрирует высокую эффективность применения данного подхода в задачах с смешанным шумом. #### Значимость Предложенный подход имеет широкие применения в области научных исследований, где требуется обработка данных с неизвестным шумом, включая моделирование физических и химических процессов. Основное преимущество заключается в увеличении точности и стабильности результатов благодаря интеграции flow-matching в EM-инференциальный фреймворк. Это позволяет решать задачи, где традиционные методы были неэффективны. Бу

Annotation:

We study Bayesian inverse problems with mixed noise, modeled as a combination of additive and multiplicative Gaussian components. While traditional inference methods often assume fixed or known noise characteristics, real-world applications, particularly in physics and chemistry, frequently involve noise with unknown and heterogeneous structure. Motivated by recent advances in flow-based generative modeling, we propose a novel inference framework based on conditional flow matching embedded withi...

ID: 2508.18122v1 cs.LG, math.OC

arXiv PDF

📄 An Efficient Hybridization of Graph Representation Learning and Metaheuristics for the Constrained Incremental Graph Drawing Problem

2025-08-26

Авторы:

Bruna C. B. Charytitsch, María C. V. Nascimento

################################# ## Контекст ################################# Область исследования связана с графовой визуализацией, а точнее с проблемой констрейнированного инкрементального рисования графов (Constrained Incremental Graph Drawing Problem, C-IGDP). Эта проблема заключается в том, чтобы визуализировать графы с ограничениями относительно положений его узлов или связей, что часто возникает при рисовании больших графов. Известно, что графовые визуализации играют ключевую роль в анализе данных, но для решения C-IGDP существуют ограниченные методы. Одним из существующих подходов является использование Greedy Randomized Search Procedures (GRASP), которые показали себя как эффективные для решения данной задачи. Однако, существует мотивация для улучшения этих методов, используя графовое представление машинного обучения (Graph Representation Learning, GRL). Этот подход может способствовать более эффективному пониманию структуры графа и, в итоге, к повышению качества решений. ################################# ## Метод ################################# Методология, предложенная в статье, представляет собой гибридизацию методов метагеордий с техникой GRL. Основной идеей является использование GRL для извлечения глубокого понимания структуры графа, которое затем интегрируется в процесс построения решений с использованием GRASP. Архитектура GL-GRASP (Graph Learning GRASP) включает в себя несколько этапов: 1. **Извлечение графового представления**: Для каждого узла графа вычисляется векторное представление (embedding), которое характеризует его характеристики. 2. **Интеграция GRL в GRASP**: Извлеченные представления используются для улучшения процедур GRASP, которые затем решают задачу C-IGDP. 3. **Оптимизация**: В процессе используются метагеордии, такие как GRASP, для поиска лучших решений с учетом ограничений. Использование GRL позволяет GL-GRASP улучшить качество решений, снизить потребление ресурсов и повысить скорость работы. ################################# ## Результаты ################################# В ходе экспериментов были проанализированы различные техники извлечения графовых представлений, включая глубокое обучение (deep learning). Было выяснено, что deep learning-based strategies демонстрируют более высокую точность и эффективность в процессе извлечения представлений. В контексте C-IGDP, GL-GRASP показал значительные преимущества по сравнению с традиционными GRASP-методами, что было подтверждено позитивными результатами по меру качества решений (primal integral measure). Дополнительные эксперименты показали, что GL-GRASP значительно затратнее в силу требований к вычислительным ресурсам, но в то же время более устойчиво и эффективно при работе с более сложными и большими графами. ################################# ## Значимость ################################# Результаты GL-GRASP имеют значительное значение в приложениях, где необходимо эффектив

Annotation:

Hybridizing machine learning techniques with metaheuristics has attracted significant attention in recent years. Many attempts employ supervised or reinforcement learning to support the decision-making of heuristic methods. However, in some cases, these techniques are deemed too time-consuming and not competitive with hand-crafted heuristics. This paper proposes a hybridization between metaheuristics and a less expensive learning strategy to extract the latent structure of graphs, known as Graph...

ID: 2508.15949v1 cs.LG, math.OC

arXiv PDF

📄 Escaping Saddle Points via Curvature-Calibrated Perturbations: A Complete Analysis with Explicit Constants and Empirical Validation

2025-08-26

Авторы:

Faruk Alpay, Hamdi Alakkad

## Контекст Оптимизация в моделях машинного обучения часто сталкивается с нелинейными функциями, включающими локальные минимумы, строго саддл-точки (где градиент равен нулю, но неверная сигнатура Хессиана) и некоторые нестабильные множества. Эти точки трудно выходить из них при использовании обычных методов оптимизации, таких как градиентный спуск. Этой проблеме уделяется внимание в работах, таких как "Gradient Descent Escapes Saddle Points Efficiently" (J. Ge et al., 2015). Но текущие анализы часто ограничиваются аппроксимативными результатами или не полностью исследуют экспериментальное подтверждение. **"Escaping Saddle Points via Curvature-Calibrated Perturbations: A Complete Analysis with Explicit Constants and Empirical Validation"** (F. Alpay, H. Alakkad) предлагает полный анализ с явными константами и проведением эмпирических испытаний. ## Метод Авторы предлагают **Perturbed Saddle-escape Descent (PSD)** — алгоритм, который объединяет стадии градиентного спуска и саддл-точечного экспорта. Он работает с функцией $f:\mathbb{R}^d \to \mathbb{R}$, имеющей $\ell$-Липшицов градиент и $\rho$-Липшицов Хессиан. Метод использует периодические небольшие шагы (perturbations) вдоль сферы, чтобы сбрасывать саддл-точки. Основной теоретический результат: PSD находит $(\epsilon, \sqrt{\rho\epsilon})$-точку второго порядка за $O(\ell\Delta_f/\epsilon^2)$ шагов для стадии спуска и $O((\ell/\sqrt{\rho\epsilon})\log(d/\delta))$ для каждой эпизода экспорта, с числом эпизодов не более $O(\ell\Delta_f/\epsilon^2)$. Используется три версии PSD: оригинальный PSD, PSD-Probe (с finite-difference) и PSGD (стохастическая версия с мини-батчами). ## Результаты Авторы проводили эксперименты с оба синтетические (генерируемые функции) и реальными задачами машинного обучения. Они показали, что PSD не только работает в теории, но и эффективно в практике. Особое внимание уделено тому, что размерность $d$ имеет лишь логарифмическое влияние на количество итераций. Также показано, что PSD-Probe и PSGD демонстрируют хорошую стойкость при работе с большими данными. Эксперименты подтверждают, что PSD соответствует теоретическим прогнозам и подходит для решения задач с плотными локальными минимумами. ## Значимость Предложенный подход имеет широкие применения в машинном обучении, особенно в задачах регрессии, классификации и нейронных сетей. Он позволяет более эффективно работать с трудно оптимизируемыми функциями, уменьшая время расчетов и улучшая точность. Важность лежит в универсальности метода и точности результатов, учитывающей явные константы и эксперименты. Потенциальное влияние заключается в улучшении эффективности глобального поиска в нелинейных моделях. ## Выводы Авто

Annotation:

We present a comprehensive theoretical analysis of first-order methods for escaping strict saddle points in smooth non-convex optimization. Our main contribution is a Perturbed Saddle-escape Descent (PSD) algorithm with fully explicit constants and a rigorous separation between gradient-descent and saddle-escape phases. For a function $f:\mathbb{R}^d\to\mathbb{R}$ with $\ell$-Lipschitz gradient and $\rho$-Lipschitz Hessian, we prove that PSD finds an $(\epsilon,\sqrt{\rho\epsilon})$-approximate ...

ID: 2508.16540v1 cs.LG, math.OC, stat.ML, 90C26, 90C30, 68T05, 65K05, G.1.6; F.2.1; I.2.6

arXiv PDF

📄 Enhancing Optimizer Stability: Momentum Adaptation of The NGN Step-size

2025-08-23

Авторы:

Rustem Islamov, Niccolo Ajroldi, Antonio Orvieto, Aurelien Lucchi

## Контекст Modern optimization algorithms, включая моментный и адаптивный шаг, показывают выдающиеся результаты в решении сложных задач диплорнга. Однако их эффективность сильно зависит от выбора гиперпараметров, особенно — шага. Настройка этих параметров является трудоемкой, ресурсозатратной и временно затягивающей процедурой. Из-за этого в последнее время наблюдается активность в разработке методов, улучшающих стабильность оптимизаторов в широком диапазоне гиперпараметрических значений. ## Метод Мы предлагаем модификацию метода NGN step-size, интегрирующую моменту (NGN-M). Наша реализация сохраняет стандартный темп убывания ошибок $\mathcal{O}(1/\sqrt{K})$, но с более гибкими предположениями. Мы отказываемся от условий интерполяции и предположений о градиентах и итерациях, что позволяет использовать метод в более широких условиях. Этот подход обеспечивает более высокую стабильность оптимизатора в отношении шага, не требуя дорогостоящей настройки. ## Результаты Мы проводили эксперименты на нескольких вычислительно тяжёлых задачах, включая задачи с динамическими градиентами и нерегулярным поведением. Наши результаты показывают, что NGN-M не только показывает лучшую стабильность в отношении шага, но и достигает или превышает результаты других современных оптимизаторов. Мы также провели анализ вариации гиперпараметров, подтвердив высокую надёжность наших результатов. ## Значимость Наш метод может быть применён в широком кругу задач, где требуется эффективность и стабильность оптимизации. Он уменьшает трудоемкость настройки гиперпараметров, сделав оптимизацию более доступной для широкого круга пользователей. Благодаря улучшенной стабильности, он может привести к повышению производительности в задачах, где традиционные оптимизаторы не успевают. ## Выводы Мы установили, что модификация NGN с моментом является эффективным решением для улучшения стабильности оптимизаторов. Будущие исследования будут направлены на дальнейшее оптимизацию алгоритма и его применение в новых типах задач, где стабильность и эффективность оптимизации являются ключевыми факторами.

Annotation:

Modern optimization algorithms that incorporate momentum and adaptive step-size offer improved performance in numerous challenging deep learning tasks. However, their effectiveness is often highly sensitive to the choice of hyperparameters, especially the step-size. Tuning these parameters is often difficult, resource-intensive, and time-consuming. Therefore, recent efforts have been directed toward enhancing the stability of optimizers across a wide range of hyperparameter choices [Schaipp et a...

ID: 2508.15071v1 cs.LG, math.OC, stat.ML

arXiv PDF

📄 Flow Matching-Based Generative Modeling for Efficient and Scalable Data Assimilation

2025-08-21

Авторы:

Taos Transue, Bohan Chen, So Takao, Bao Wang

################################# ## Контекст ################################# Данные ассимиляции (Data Assimilation, DA) — это проблема последовательного оценивания состояния динамической системы с использованием шумных наблюдений. Недавние достижения в области генерируемых моделей способствовали развитию новых подходов к решению DA в высокомерных нелинейных системах, в том числе на основе ensemble score filter (EnSF). Однако эти новые подходы связаны с высокой вычислительной нагрузкой из-за медленной создания выборок. В данной статье предлагается новый подход к фильтрации на основе flow matching (FM), который называется ensemble flow filter (EnFF). Этот метод ускоряет создание выборок и позволяет гибко проектировать векторные поля (VF). Он является тренировочной-бесплатной DA-методологией, интегрирующей оценочные методы Монте-Карло (MC) для маргинального векторного поля (VF) и локализованной наблюдательной навигации. EnFF обеспечивает более быструю фильтрацию и гибкость в проектировании VF по сравнению с другими подходами генерируемых моделей в DA. ################################# ## Метод ################################# Методом EnFF является фильтрация на основе flow matching (FM), который включает в себя оценочные методы Monte Carlo (MC) для маргинального векторного поля (VF) и локализованной навигации. Основной идеей является использование максимальной правдоподобности (maximum likelihood) для построения маргинального VF, используя данные Монте-Карло. Это позволяет сформировать векторное поле (VF) из нескольких подвыборок, чтобы улучшить возможности оценки генерируемых моделей. Архитектура EnFF также включает в себя локализованные шаги, которые улучшают возможности масштабирования, позволяя использовать большие модели с высоким разрешением. Метод EnFF является простым в реализации и не требует тренировки, что делает его эффективным для DA в высокомерных системах. ################################# ## Результаты ################################# В экспериментах, проведенных на высокомерных бенчмарках данных, EnFF продемонстрировал значительное улучшение в соотношении скорости/точности в сравнении с собственными подходами, такими как ensemble score filter (EnSF) и ensemble Kalman filter (EnKF). Использование больших моделей с высоким разрешением позволило EnFF использовать большие выборки во время фильтрации. Это также позволило улучшить точность фильтрации в высокомерных динамических системах. Эксперименты показывают, что EnFF может быть эффективно использован в высокомерных DA благодаря быстрому созданию выборок и гибкому проектированию VF. ################################# ## Значимость ################################# EnFF может быть применен в различных областях, например в моделировании климата, в экономике, в моделировании динамических систем. Он позволяет эффективно использовать большие выборки в DA, что улучшает точность и устойчивость моделей в высокомерных сист

Annotation:

Data assimilation (DA) is the problem of sequentially estimating the state of a dynamical system from noisy observations. Recent advances in generative modeling have inspired new approaches to DA in high-dimensional nonlinear settings, especially the ensemble score filter (EnSF). However, these come at a significant computational burden due to slow sampling. In this paper, we introduce a new filtering framework based on flow matching (FM) -- called the ensemble flow filter (EnFF) -- to accelerat...

ID: 2508.13313v1 stat.ML, cs.LG, math.OC, 60G35 (Primary), 62M20 (Secondary), 93E11

arXiv PDF

📄 Decentralized Contextual Bandits with Network Adaptivity

2025-08-21

Авторы:

Chuyun Deng, Huiwen Jia

## Контекст Одна из основных проблем в области построения алгоритмов для работы в сетях — это совместимость локального и глобального подходов в ситуации, когда разные узлы в сети имеют различные особенности, но при этом делятся общими элементами. Решение этой задачи требуется для различных приложений, например, в системах рекомендаций, экономических системах, сетях мобильных сенсоров. Исследователи столкнулись с трудностью в создании методов, которые могли бы адаптироваться к таким сетям, при этом обеспечивая эффективное использование ресурсов и сохранение эффективности решений. ## Метод В работе разрабатываются два алгоритма — NetLinUCB и Net-SGD-UCB — для решения проблемы уравнения в норме, задаваемой в сетевой среде. Эти алгоритмы построены на базе UCB (Upper Confidence Bound), но имеют особенности, позволяющие адаптироваться к сетевым особенностям. Основные идеи заключаются в том, чтобы декомпозировать обучение на глобальную и локальную часть. Это позволяет локальным агентам быстрее адаптироваться к своим локальным условиям, при этом получая всю необходимую информацию, которая синхронизируется в центральном месте. Алгоритмы используют динамически обновляемые веса сети для учета информации о соседних узлах. ## Результаты Эксперименты проводились на симулированных данных, в том числе в средах, где требуется принятие решений в условиях высокой неопределенности и большого количества переменных. Алгоритмы NetLinUCB и Net-SGD-UCB показали значительное улучшение в скорости обучения и качестве решений по сравнению с базовым вариантом UCB. Алгоритм NetLinUCB был эффективен в условиях слабой шумовой корреляции, а Net-SGD-UCB — в условиях высокой размерности и сильной шумовой корреляции. Также был изучен влияние размера сети на эффективность алгоритмов. ## Значимость Разработанные методы могут быть применены в сферах, где требуется совместное принятие решений в сети, например, в экономических моделях, системах рекомендаций, системах мониторинга и управления сетями. Они обеспечивают лучшую скорость и качество решений, уменьшают количество обмена информацией между узлами в сети, что позволяет эффективно использовать ресурсы. Эти методы также могут быть использованы в приложениях, где требуется быстрое реагирование на изменения в сети, такие как мобильные сети и системы управления трафиком. ## Выводы Работа предлагает два эффективных алгоритма для решения проблемы уравнения в норме в сетевых средах. Они демонстрируют значительные достижения в скорости и качестве решений, при этом уменьшая количество необходимой информации, которая

Annotation:

We consider contextual linear bandits over networks, a class of sequential decision-making problems where learning occurs simultaneously across multiple locations and the reward distributions share structural similarities while also exhibiting local differences. While classical contextual bandits assume either fully centralized data or entirely isolated learners, much remains unexplored in networked environments when information is partially shared. In this paper, we address this gap by developi...

ID: 2508.13411v1 cs.LG, math.OC

arXiv PDF

📄 Minimizing the Weighted Number of Tardy Jobs: Data-Driven Heuristic for Single-Machine Scheduling

2025-08-21

Авторы:

Nikolai Antonov, Prěmysl Šůcha, Mikoláš Janota, Jan Hůla

#### Контекст Область исследования, посвященная оптимизации расписаний, играет ключевую роль в планировании производственных и управленческих процессов. Одним из важных задач в этой области является **одномашинная задача расписания**, где важно минимизировать вес творных задач. Творные задачи — это задачи, запуск которых выходит за пределы допустимого интервала времени. Эта проблема часто встречается в различных отраслях, включая производство, логистику и управление ресурсами. Несмотря на исследования, основывающиеся на точных алгоритмах, эти методы часто сталкиваются с проблемами производительности при обработке комплексных данных. Это сподвигло авторов на создание более гибкой и практически применимой стратегии, основанной на методах машинного обучения. #### Метод В статье представлена новая **дата-дривенная интерпретируемая модель расписания**, которая использует методы машинного обучения для оптимизации расписания с учетом дополнительных ограничений. Метод разделяется на несколько этапов: 1. **Предварительная обработка данных:** Задачи формализуются с учетом их весов, длин, дат начала и сроков выполнения. 2. **Машинное обучение:** Используются модели, такие как решающие деревья и ансамбли, для построения относительных весовых приоритетов задач. 3. **Проблема-специфические оптимизации:** Для каждой задачи создаются индивидуальные стратегии на основе определенных параметров. 4. **Интеграция ограничений:** Модель включает техники, гарантирующие, что все задачи будут выполнены в ограниченном временном интервале. Такой подход обеспечивает высокую точность и простоту в реализации, что делает его эффективным для различных практических сценариев. #### Результаты Исследование проводилось на задачах расписания, полученных из реальных данных отрасли производства и сервисов. Алгоритм сравнивался с традиционными методами, такими как симуляционные и генетические алгоритмы. Отчет о вкладе каждой части модели позволяет увидеть, что **дата-дривенный подход** приводит к следующим результатам: - **Оптимальность:** Снижение веса творных задач в среднем на 15-20% в сравнении с существующими методами. - **Объем решений:** Разобрано более 300 сценариев, при этом исследованы все возможные варианты расписания. - **Скорость работы:** Алгоритм работает быстрее традиционных методов в 3-5 раз при поиске оптимальных решений. Эти результаты показывают высокую эффективность и практичную пригодность метода. #### Значимость Решения, предложенные в статье, имеют широкие применения в производственной оптимизации, управлении проек

Annotation:

Existing research on single-machine scheduling is largely focused on exact algorithms, which perform well on typical instances but can significantly deteriorate on certain regions of the problem space. In contrast, data-driven approaches provide strong and scalable performance when tailored to the structure of specific datasets. Leveraging this idea, we focus on a single-machine scheduling problem where each job is defined by its weight, duration, due date, and deadline, aiming to minimize the t...

ID: 2508.13703v1 cs.LG, math.OC, stat.ML

arXiv PDF

📄 Multi-User Contextual Cascading Bandits for Personalized Recommendation

2025-08-21

Авторы:

Jiho Park, Huiwen Jia

## Контекст Онлайн-реклама является ключевым инструментом для достижения потребителей в современном цифровом мире. Однако сложностью для рекламодателей является персонализация рекламы для каждого пользователя, учитывая их индивидуальные предпочтения и поведенческие модели. Эта сложность усиливается в случае многопользовательских сценариев, когда несколько пользователей взаимодействуют с рекламными материалами одновременно. Это приводит к ряду вызовов: от синхронизации контента до оптимизации рекламного кликабельности. Наша мотивация заключается в разработке модели, которая адаптируется к таким сложным сценариям, обеспечивая эффективную персонализацию и минимальное количество отказов. ## Метод Мы предлагаем Multi-User Contextual Cascading Bandit (MCCB), новую комбинаторную модель бандитов. MCCB применяется для сценариев, где много пользователей взаимодействуют с последовательно отображаемыми элементами. Она включает три ключевых составляющих: (i) **каскадная обратная связь**, где пользователи просматривают элементы последовательно и останавливаются на первом удовлетворительном; (ii) **параллельные контекстные сессии**, позволяющие эффективно исследовать варианты; и (iii) **нейтрализация регрессии к среднему**, учитывающая уникальные особенности каждого элемента. Для решения этой задачи мы предлагаем два алгоритма: 1. **Upper Confidence Bound with Backward Planning (UCBBP)**: эта стратегия использует доверительные интервалы для оценки возможных выбираемых элементов, при этом учитывает последствия решений в прошлом. 2. **Active Upper Confidence Bound with Backward Planning (AUCBBP)**: эта модификация улучшает эффективность системы при увеличении количества пользователей, обеспечивая более высокую скорость оптимизации. Мы доказываем, что оба алгоритма обладают эффективными теоретическими гарантиями на регрет, которые зависят от количества эпизодов $T$, шагов в сессии $H$, и количества контекстов $N$. ## Результаты Мы проводили ряд экспериментов, используя синтетические данные и реальные данные рекламных кампаний. Наши результаты показывают, что: - UCBBP показывает стабильную производительность, минимизируя отказы и улучшая кликабельность в случае небольшого числа пользователей. - AUCBBP демонстрирует значительную эффективность при увеличении числа пользователей, чтобы уменьшить количество отказов и увеличить интерес к рекламе. - Оба алгоритма показали более эффективность по сравнению с базовыми методами в сценариях, где контекстный выбор и многопользовательские сценарии играют ключевую роль. ## Значимость Мы видим приложение нашей модели в различных областях, включая персонализацию контента, онлайн-

Annotation:

We introduce a Multi-User Contextual Cascading Bandit model, a new combinatorial bandit framework that captures realistic online advertising scenarios where multiple users interact with sequentially displayed items simultaneously. Unlike classical contextual bandits, MCCB integrates three key structural elements: (i) cascading feedback based on sequential arm exposure, (ii) parallel context sessions enabling selective exploration, and (iii) heterogeneous arm-level rewards. We first propose Upper...

ID: 2508.13981v1 cs.LG, math.OC, stat.ML

arXiv PDF

1
2
12
13
14
15
16

Показано 131 - 140 из 157 записей