Convex Regression with a Penalty
2509.19788v1
stat.ML, cs.LG
2025-09-26
Авторы:
Eunji Lim
Резюме на русском
## Контекст
В области математической статистики и алгоритмической геометрии возникает частое требование оценивать неизвестные конвексные функции $f_0$, определяемые на подмножестве $\Omega \subset \mathbb{R}^d$. Одним из распространенных подходов является минимизация квадратичного ошибки, но этот метод часто приводит к переобучению, особенно вблизи границ $\Omega$. Это становится критически важным при применении в реальных задачах, таких как моделирование времени ожидания в системах очередей. Недостаток существующих методов побудил создать более точный и устойчивый подход к оценке конвексных функций, снижающий риск переобучения и улучшающий точность оценок.
## Метод
Метод предлагает минимизировать не только квадратичную ошибку, но и добавить в расчет пенальти за превышение заданного порога $s_n$ на сумму квадратов ошибок. Это позволяет стабилизировать оценку и уменьшить ошибки вблизи границ $\Omega$. Основной инновацией является то, что порог $s_n$ может быть эффективно оценен на основе данных, что упрощает применение алгоритма. Архитектура метода основывается на регуляризации субградиента, гарантирующей устойчивость и точность. Решения получаются с помощью метода градиентного спуска, применяемого к регуляризованной функции потерь.
## Результаты
Для исследования проведены эксперименты на синтетических и реальных данных, включая задачу моделирования времени ожидания в односерверной системе очередей. Данные были сгенерированы с использованием заданной конвексной функции, добавленной шума. Результаты показывают, что предложенный метод показывает значительно меньшую ошибку оценки по сравнению с традиционным методом, особенно вблизи границ. Уточненные теоретические расчеты подтверждают почти строгое постоянство и сходимость решений, а также демонстрируют развитие их скорости при увеличении объема данных.
## Значимость
Предложенный подход может быть применен в различных областях, где необходимо оценивать конвексные зависимости. Особое применение — в задачах, характеризующихся высоким шумом и важностью предотвращения переобучения. В системах очередей, электронной коммерции и экономике, это позволяет получать более точные и надежные прогнозы. Преимуществом является уменьшение ошибок вблизи границ, что особенно важно в ситуациях с геометрическими или граничными ограничениями. Этот метод может повлиять на развитие методов нейронных сетей, моделирования биологических систем и т. д.
## Выводы
На основе проведенных экспериментов и теоретических анализов был доказан высокий эффективность
Abstract
A common way to estimate an unknown convex regression function $f_0: \Omega
\subset \mathbb{R}^d \rightarrow \mathbb{R}$ from a set of $n$ noisy
observations is to fit a convex function that minimizes the sum of squared
errors. However, this estimator is known for its tendency to overfit near the
boundary of $\Omega$, posing significant challenges in real-world applications.
In this paper, we introduce a new estimator of $f_0$ that avoids this
overfitting by minimizing a penalty on the subgradient while enforcing an upper
bound $s_n$ on the sum of squared errors. The key advantage of this method is
that $s_n$ can be directly estimated from the data. We establish the uniform
almost sure consistency of the proposed estimator and its subgradient over
$\Omega$ as $n \rightarrow \infty$ and derive convergence rates. The
effectiveness of our estimator is illustrated through its application to
estimating waiting times in a single-server queue.
Ссылки и действия
Дополнительные ресурсы: