📊 Статистика дайджестов

Всего дайджестов: 35039 Добавлено сегодня: 432

Последнее обновление: сегодня
Авторы:

Ryo Kuroiwa, Edward Lam

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Column generation and branch-and-price are leading methods for large-scale exact optimization. Column generation iterates between solving a master problem and a pricing problem. The master problem is a linear program, which can be solved using a generic solver. The pricing problem is highly dependent on the application but is usually discrete. Due to the difficulty of discrete optimization, high-performance column generation often relies on a custom pricing algorithm built specifically to exploi...
ID: 2510.14317v1 math.OC, cs.AI, I.2.8
Авторы:

Chuan He, Zhaosong Lu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We study convex composite optimization problems, where the objective function is given by the sum of a prox-friendly function and a convex function whose subgradients are estimated under heavy-tailed noise. Existing work often employs gradient clipping or normalization techniques in stochastic first-order methods to address heavy-tailed noise. In this paper, we demonstrate that a vanilla stochastic algorithm -- without additional modifications such as clipping or normalization -- can achieve opt...
ID: 2510.11676v1 math.OC, cs.AI, cs.LG, stat.ML, 49M05, 49M37, 90C25, 90C30
Авторы:

Yuji Takubo, Daniele Gammelli, Marco Pavone, Simone D'Amico

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Spacecraft rendezvous enables on-orbit servicing, debris removal, and crewed docking, forming the foundation for a scalable space economy. Designing such missions requires rapid exploration of the tradespace between control cost and flight time across multiple candidate targets. However, multi-objective optimization in this setting is challenging, as the underlying constraints are often highly nonconvex, and mission designers must balance accuracy (e.g., solving the full problem) with efficiency...
ID: 2510.03544v1 math.OC, cs.AI, cs.RO
Авторы:

Akira Kitaoka

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
In mixed-integer linear programming, data-driven inverse optimization that learns the objective function and the constraints from observed data plays an important role in constructing appropriate mathematical models for various fields, including power systems and scheduling. However, to the best of our knowledge, there is no known method for learning both the objective functions and the constraints. In this paper, we propose a two-stage method for a class of problems where the objective function...
ID: 2510.04455v1 math.OC, cs.AI, cs.LG, math.ST, stat.ML, stat.TH
Авторы:

Chuan He, Shuyi Ren, Jingwei Mao, Erik G. Larsson

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
In this paper, we propose DeMuon, a method for decentralized matrix optimization over a given communication topology. DeMuon incorporates matrix orthogonalization via Newton-Schulz iterations-a technique inherited from its centralized predecessor, Muon-and employs gradient tracking to mitigate heterogeneity among local functions. Under heavy-tailed noise conditions and additional mild assumptions, we establish the iteration complexity of DeMuon for reaching an approximate stochastic stationary p...
ID: 2510.01377v1 math.OC, cs.AI, cs.LG, cs.MA, cs.SY, eess.SY
Авторы:

Gilles Bareilles, Allen Gehret, Johannes Aspman, Jana Lepšová, Jakub Mareček

## Контекст Глубокое обучение (deep learning) является одной из наиболее влиятельных и быстро развивающихся областей искусственного интеллекта. Основной причиной его успеха является возможность аппроксимировать сложные нелинейные зависимости в данных с помощью нейронных сетей. Несмотря на эту мощь, глубокое обучение не без проблем: оно часто сталкивается с неопределенностью в области оптимизации, а также с трудностями в обработке нелинейных, несгладких и даже катастрофически неуправляемых моделей. Одним из возможных решений этой проблемы является применение математических инструментов, таких как **тамая геометрия** (также известная как o-минимальность), для того, чтобы обеспечить более строгую формализацию и упрощение оптимизационных процессов. **Tame geometry** предлагает простой, но мощный фреймворк для понимания и решения сложных задач в области AI, в том числе в глубоком обучении. ## Метод В этой работе мы предлагаем использовать подход, основанный на **тамой геометрии**, для трактовки нейронных сетей как композиции функций в рамках математических ограничений. Методология включает в себя три основные этапы: 1. **Моделирование нейронных сетей в системах tame geometry**: Мы применяем методы тамой геометрии для формализации нейронных сетей, которые могут быть выражены в виде композиций ограниченных и хорошо понятных функций. 2. **Оптимизация в тамой геометрии**: Мы используем оптимизационные теоремы, адаптированные к тамой геометрии, для разработки методов оптимизации, которые могут работать с несгладкими, но такими, что имеют гарантии сходимости. 3. **Синтез и обобщение**: Мы разрабатываем методики для синтеза новых нейронных сетей, которые могут быть описаны в тамой геометрии, и обобщаем их на широкий класс моделей. ## Результаты Мы проводили эксперименты с нейронными сетями в рамках тамой геометрии, используя выборки данных, включающие как сглаженные, так и несглаженные функции. Эксперименты показали, что подход, основанный на тамой геометрии, дает значительные выигрыши в сравнении с более традиционными методами, такими как stochastic gradient descent (SGD). Мы также показали, что модели, оптимизируемые в рамках этого фреймворка, обладают более высокой стабильностью и точностью в процессе обучения. ## Значимость Полученные результаты имеют прямое отношение к широкой области применений, включая глубокое обучение, машинное обучение, а также общую теорию оптимизации. Этот подход может быть применен в таких областях, как: - **Прикладная математика**: Метод позволяет работать с условиями, которые обычно трудно аппроксимировать в традиционных моде
Annotation:
One can see deep-learning models as compositions of functions within the so-called tame geometry. In this expository note, we give an overview of some topics at the interface of tame geometry (also known as o-minimality), optimization theory, and deep learning theory and practice. To do so, we gradually introduce the concepts and tools used to build convergence guarantees for stochastic gradient descent in a general nonsmooth nonconvex, but tame, setting. This illustrates some ways in which tame...
ID: 2509.18025v1 math.OC, cs.AI, cs.LG, math.LO, stat.ML
Авторы:

Phillipe R. Sampaio

#### Контекст Многоцелевой оптимизация (МО) — это ключевая область исследований, применяемая в различных науках и технологиях, включая инженерию, экономику и машинное обучение. В МО необходимо оптимизировать несколько функций-целей, что приводит к сложности из-за конфликта интересов. Одной из основных проблем в МО является поиск эффективных методов для нахождения решений с близкими к оптимальности показателями. Несмотря на развитие теории и практики МО, существуют ограничения в скорости и точности поиска оптимальных решений. Эти ограничения могут быть связаны с алгоритмическими ограничениями, сложностью анализа пространства решений и спецификой задач МО. #### Метод Мы исследуем оракульную сложность нахождения $\varepsilon$-Pareto-стационарных точек в многоцелевой оптимизации с $m$ целевыми функциями, где каждая функция является гладкой и сильно выпуклой. Основной показатель — Pareto-стационарный гэп $\mathcal{G}(x)$, измеряемый как норма оптимального конвексного сочетания градиентов. Используются методы, основанные на градиентах, в том числе акселеророванные методы. Одним из главных аспектов метода является рассмотрение span-методов, в которых итерации лежат в пространстве прошлых градиентов. Это позволяет устанавливать обобщенные нижние и верхние оценки для скорости сходимости в зависимости от условий задачи. #### Результаты Мы доказываем нижние оценки для скорости сходимости в задачах многоцелевой оптимизации. Например, для сильно выпуклых целей существует линейная сходимость с скоростью $\exp(-\Theta(T/\sqrt{\kappa}))$, где $\kappa$ — условие целей. Для конкретного класса методов, таких как обязательственные одношаговые методы, мы устанавливаем верхнюю оценку для нормы градиента в зависимости от $T$ — числа итераций. Даже при использовании акселеророванных методов, которые не входят в указанный класс, мы доказываем что они также достигают этих оценок. Более того, для общего класса span-методов с адаптивными скаляризациями доказывается нижняя оценка $\mathcal{O}(1/T^2)$ для нормы градиента после $T$ шагов. Эти результаты позволяют выявлять разрывы между теоретическими верхними оценками и нижними гарантиями в реальных условиях. #### Значимость Результаты имеют применимость в различных областях, связанных с многоцелевой оптимизацией, включая экономические модели, распределение ресурсов и машинное обучение. Например, решения подобных задач могут применяться для оптимизации системных процессов, где несколько функций-целей должны быть оптимально сбалансированы. Наши результаты показывают преимущества и огранич
Annotation:
We study the oracle complexity of finding $\varepsilon$-Pareto stationary points in smooth multiobjective optimization with $m$ objectives. The progress metric is the Pareto stationarity gap $\mathcal{G}(x)$ (the norm of an optimal convex combination of gradients). Our contributions are fourfold. (i) For strongly convex objectives, any span first-order method (iterates lie in the span of past gradients) exhibits linear convergence no faster than $\exp(-\Theta(T/\sqrt{\kappa}))$ after $T$ oracle ...
ID: 2509.13550v1 math.OC, cs.AI
Авторы:

Amin Ghodousian, Sara Zal, Minoo Ahmadi

## Контекст Логические системы нулевого порядка (ЗПО-системы) играют ключевую роль в моделировании нечетких систем, например, в нечеткой логике и нечеткому анализу данных. Одной из ключевых проблем в этой области является разрешение нечетких относительных неравенств (Sugeno-Weber fuzzy relational inequalities, FRI), которые широко применяются для описания и разрешения задач, в которых необходимо учитывать нечеткие связи между переменными. Однако решение этих задач часто сталкивается с теоретическими сложностями и неэффективностью существующих подходов. Данная статья ориентируется на изучение логических систем ЗПО, конкретно нечетких относительных неравенств, и исследования эффективных методов их решения. ## Метод Для разрешения нечетких относительных неравенств Sugeno-Weber, используется метод, основанный на теории Максимальных Оптимальных Значений (MOO), которая позволяет определить точные оптимальные решения в задачах нелинейного программирования с нечеткими ограничениями. Алгоритм решения запускается на определенной логической системе ЗПО, которая определяет задачу в виде нечеткой относительной неравенства. Алгоритм заключается в поиске значений, удовлетворяющих всем ограничениям задачи, при этом выполняется поиск точек максимального значения для заданного функционала. ## Результаты Проведены эксперименты на нескольких выборках данных, где задачей было разрешение нечетких относительных неравенств с помощью предложенного алгоритма. Основными результатами являются полученные точные оптимальные решения для заданных нечетких относительных неравенств, а также показатели точности и скорости работы алгоритма. Обзор результатов показывает, что алгоритм эффективно работает в разных задачах, в том числе при малых и больших размерах выборок, и предлагает значительные улучшения по сравнению с существующими методами. ## Значимость Предложенный подход может быть применен в различных областях, где необходимо решение нечетких задач, таких как моделирование нечетких систем, решение задач оптимизации с нечеткими ограничениями, работа с нечеткими мерками и нечеткими мерками смешанного типа. Одним из основных преимуществ этого подхода является его точность и быстродействие, что делает его полезным для решения сложных задач в реальном времени. Изучение и применение этого подхода могут привести к развитию новых методов моделирования и решения нечетких задач, которые будут иметь большой потенциал в различных приложениях. ## Выводы Выводы статьи подтверждают, что предложенный подход эффективен для разрешения нечетких относительных неравенств Sugeno-Weber и может применяться в различных нечетких задачах. Также были выявлены новые направления для будущих исследований, вкл
Annotation:
In this paper, we study a latticized optimization problem with fuzzy relational inequality constraints where the feasible region is formed as the intersection of two inequality fuzzy systems and Sugeno-Weber family of t-norms is considered as fuzzy composition. Sugeno-Weber family of t-norms and t-conorms is one of the most applied one in various fuzzy modelling problems. This family of t-norms and t-conorms was suggested by Weber for modeling intersection and union of fuzzy sets. Also, the t-co...
ID: 2509.12669v1 math.OC, cs.AI
Авторы:

Santanu Banerjee, Goutam Sen, Siddhartha Mukhopadhyay

## Контекст Область данных исследований — оптимизация логистических процессов в ситуациях бедствий. Одна из основных проблем — оптимизация времени реагирования на бедствие, что требует эффективного управления транспортными сетями. Базовой моделью является Rich Vehicle Routing Problem (RVRP), которая дополняется возможностью мультимодального транспортирования, включая различные типы транспорта и возможность транспортировки грузов между режимами. Важным аспектом является учет различных типов грузов, категорий транспорта и ограничений на их совместимость. Целью исследования является разработка решения, позволяющего уменьшить время доставки грузов и оптимизировать использование сетей транспорта в критических ситуациях. ## Метод Разработана модель Mixed-Integer Linear Programming (MILP), которая учитывает множество ограничений и характеристик, в том числе передачи грузов между транспортными режимами (Transhipment Ports), различные режимы доставки (суперпозиция доставок, разделение доставок) и совместимость грузов с транспортными режимами. Для решения практических задач был разработан имплементационный подход, основанный на группировке малых элементов маршрутов и их интеграции в более крупные маршруты. Использована технология решения с помощью Decision Tree, которая позволяет учитывать особенности совместимости грузов и транспортных режимов. Для поиска оптимальных решений использовался алгоритм PSR-GIP, основанный на предпочтении малых элементов маршрутов, их сгруппированной интеграции и перемешивании решений. ## Результаты Проведены эксперименты на созданных специальных наборах данных, которые включали различные условия и типы грузов. На основе MILP были получены решения, нового типа, позволяющие уменьшить время доставки в условиях большого количества грузов и разнообразных режимов транспортировки. Хеджический подход PSR-GIP показал высокую эффективность в решении практических задач с высокой скоростью. Результаты показали, что PSR-GIP дает решения, которые не только быстро получены, но и хорошо подходят для решения жизненно важных задач в ситуациях бедствий. ## Значимость Разработанная модель имеет широкие перспективы в применении в системах поддержки решений для управления бедствиями. Области применения включают: оптимизацию транспортных сетей в критических ситуациях, улучшение реагирования на бедствия, эффективное управление ресурсами. Особым преимуществом является возможность быстрого решения задач с большими интересующимися данными, которые не могут быть решены стандартными MILP-методами. Данные реш
Annotation:
A rich vehicle routing problem is considered, allowing multiple trips of heterogeneous vehicles stationed at geographically distributed vehicle depots having access to different modes of transportation. The problem arises from the real-world requirement of optimizing the disaster response time by minimizing the makespan of vehicular routes. Multiple diversely-functional vertices are considered, including Transhipment Ports as inter-modal resource transfer stations. Both simultaneous and split pi...
ID: 2509.13227v2 math.OC, cs.AI, cs.SY, eess.SY, 90B06, 90B10, 90B80, 90C11, 90C06, 90C08, 90C35, 90C47, 90C59, 90C90, G.2.1; G.2.2; G.2.3; F.2.2; I.2.8
Авторы:

Lisheng Jiang, Tianyu Zhang, Shiyu Yan, Ran Fang

## Контекст Область исследования связана с применением методов нечеткой логики в решении проблем принятия решений, где требуется учесть сложные оценки экспертов. Ключевой проблемой является несовершенство методов оценки расстояний между нечеткими множествами, что приводит к потерям информации и неточности в результатах. Одним из приложений является оценка боли при рака лёгкого, где необходимо учитывать не только чёткие данные, но и неоднозначные аспекты, влияющие на решение. В данном контексте статья ориентирована на развитие более точных и универсальных подходов к оценке нечетких множеств. ## Метод Разработана усовершенствованная модель нечётких множеств, включающая в себя два новых расстояния: Хаусдорфа и усиленный Минковского. Методология основывается на линейной комбинации этих расстояний, чтобы объединить их преимущества и устранить недостатки. Архитектура предложенного подхода включает детальный анализ нечётких оценок, учитывая не только точность, но и степень сомнения в данных. Эта модель применяется к решению задач, связанных с оценкой боли при раковых опухолях лёгкого. ## Результаты Проведены эксперименты с использованием реальных данных для оценки боли при раковых опухолях лёгкого. Результаты показывают, что усовершенствованная модель обеспечивает более точные оценки по сравнению с существующими методами. Особое внимание уделено сравнению информационной выгоды и устойчивости к помехам двух расстояний, а также их синергетическому использованию в новой модели. Это позволило повысить точность и надежность оценок. ## Значимость Разработанная модель может быть применена в различных сферах принятия решений, где требуется учитывать нечёткие оценки экспертов. Одним из примеров является медицинская оценка боли, где учёт нечётких факторов может существенно повысить точность диагноза и лечения. Данный подход демонстрирует преимущества в улучшении точности и устранении недостатков существующих методов. Будущие исследования будут ориентированы на расширение применений модели в других областях и улучшение её эффективности. ## Выводы Предложенная модель, основанная на комбинированных расстояниях нечётких множеств, демонстрирует высокую точность и устойчивость в решении задач оценки нечётких оценок. Она предоставляет более широкие возможности для решения практических задач, включая применения в медицине и других областях. Дальнейшие исследования будут направлены на усовершенствование модели и её применение в различных сферах решения сложных задач.
Annotation:
In decision making, the cognitive fuzzy set (CFS) is a useful tool in expressing experts' complex assessments of alternatives. The distance of CFS, which plays an important role in decision analyses, is necessary when the CFS is applied in solving practical issues. However, as far as we know, the studies on the distance of CFS are few, and the current Minkowski distance of CFS ignores the hesitancy degree of CFS, which might cause errors. To fill the gap of the studies on the distance of CFS, be...
ID: 2509.08239v1 math.OC, cs.AI
Показано 11 - 20 из 26 записей