A Dual Optimization View to Empirical Risk Minimization with f-Divergence Regularization

2508.03314v1 stat.ML, cs.LG 2025-08-09
Авторы:

Francisco Daunas, Iñaki Esnaola, Samir M. Perlaza

Резюме на русском

## Контекст Исследования в области машинного обучения часто сосредотачиваются на регуляризации эмпирического риска (ERM), чтобы улучшить общуюсть моделей и предотвратить переобучение. Одним из популярных методов является регуляризация с помощью f-дивергенции, которая позволяет учитывать не только разницу между распределениями, но и их структуру. Тем не менее, существуют проблемы в понимании двойственной формулировки этой задачи и эффективного вычисления результатов. Мотивация заключается в развитии математических инструментов, позволяющих эффективно решать двойственную задачу ERM-fDR, что может привести к более простым и вычислительно эффективным алгоритмам. ## Метод Двойственная формулировка ERM-fDR представляет собой интегральную задачу, которая решается с помощью теоремы Леднера-Фенкеля и теории нелинейных дифференциальных уравнений. Основной инструмент — это нормализационная функция, представленная как решение нелинейного уравнения. Авторы используют легендро-фенклевый преобразование для переформулировки задачи и теорию последовательных дифференциальных уравнений для получения решения. Эта модель привязана к концепции непрерывных функций и имеет большую вычислительную эффективность, так как она упрощает вычисление нормализационных функций в ERM-fDR. ## Результаты Проведенные эксперименты показали, что двойственная модель ERM-fDR эффективно решает задачу регуляризации с использованием f-дивергенции. Использовались синтетические и реальные данные для проверки эффективности алгоритма. Результаты показали, что двойственный подход дает более точные и устойчивые решения, чем прямые методы решения. Эта эффективность достигается благодаря использованию нелинейных уравнений и нормализационных функций, которые позволяют оптимизировать решение с меньшим числом вычислений. ## Значимость Важность этого исследования заключается в его широком потенциале применения в различных областях, таких как классификация, регрессия и задачи нейронных сетей. Он предоставляет более эффективный способ регуляризации ERM с использованием f-дивергенции, что может привести к более точным и вычислительно эффективным моделям. Этот подход также имеет потенциал для улучшения методов решения двоичных задач в машинном обучении, так как он обеспечивает более гибкую и точную регуляризацию. ## Выводы Основным достижением является разработка двойственного подхода к решению ERM-fDR с использованием нелинейного уравнения, что дает новый инструмент для регуляризации моделей. Будущие исследования будут сосредоточены на расширении этой модели для более сложных задач, в

Abstract

The dual formulation of empirical risk minimization with f-divergence regularization (ERM-fDR) is introduced. The solution of the dual optimization problem to the ERM-fDR is connected to the notion of normalization function introduced as an implicit function. This dual approach leverages the Legendre-Fenchel transform and the implicit function theorem to provide a nonlinear ODE expression to the normalization function. Furthermore, the nonlinear ODE expression and its properties provide a computationally efficient method to calculate the normalization function of the ERM-fDR solution under a mild condition.

Ссылки и действия