Convex Regression with a Penalty

2509.19788v1 stat.ML, cs.LG 2025-09-26

Авторы:

Eunji Lim

Резюме на русском

## Контекст В области математической статистики и алгоритмической геометрии возникает частое требование оценивать неизвестные конвексные функции $f_0$, определяемые на подмножестве $\Omega \subset \mathbb{R}^d$. Одним из распространенных подходов является минимизация квадратичного ошибки, но этот метод часто приводит к переобучению, особенно вблизи границ $\Omega$. Это становится критически важным при применении в реальных задачах, таких как моделирование времени ожидания в системах очередей. Недостаток существующих методов побудил создать более точный и устойчивый подход к оценке конвексных функций, снижающий риск переобучения и улучшающий точность оценок. ## Метод Метод предлагает минимизировать не только квадратичную ошибку, но и добавить в расчет пенальти за превышение заданного порога $s_n$ на сумму квадратов ошибок. Это позволяет стабилизировать оценку и уменьшить ошибки вблизи границ $\Omega$. Основной инновацией является то, что порог $s_n$ может быть эффективно оценен на основе данных, что упрощает применение алгоритма. Архитектура метода основывается на регуляризации субградиента, гарантирующей устойчивость и точность. Решения получаются с помощью метода градиентного спуска, применяемого к регуляризованной функции потерь. ## Результаты Для исследования проведены эксперименты на синтетических и реальных данных, включая задачу моделирования времени ожидания в односерверной системе очередей. Данные были сгенерированы с использованием заданной конвексной функции, добавленной шума. Результаты показывают, что предложенный метод показывает значительно меньшую ошибку оценки по сравнению с традиционным методом, особенно вблизи границ. Уточненные теоретические расчеты подтверждают почти строгое постоянство и сходимость решений, а также демонстрируют развитие их скорости при увеличении объема данных. ## Значимость Предложенный подход может быть применен в различных областях, где необходимо оценивать конвексные зависимости. Особое применение — в задачах, характеризующихся высоким шумом и важностью предотвращения переобучения. В системах очередей, электронной коммерции и экономике, это позволяет получать более точные и надежные прогнозы. Преимуществом является уменьшение ошибок вблизи границ, что особенно важно в ситуациях с геометрическими или граничными ограничениями. Этот метод может повлиять на развитие методов нейронных сетей, моделирования биологических систем и т. д. ## Выводы На основе проведенных экспериментов и теоретических анализов был доказан высокий эффективность

Abstract

A common way to estimate an unknown convex regression function $f_0: \Omega \subset \mathbb{R}^d \rightarrow \mathbb{R}$ from a set of $n$ noisy observations is to fit a convex function that minimizes the sum of squared errors. However, this estimator is known for its tendency to overfit near the boundary of $\Omega$, posing significant challenges in real-world applications. In this paper, we introduce a new estimator of $f_0$ that avoids this overfitting by minimizing a penalty on the subgradient while enforcing an upper bound $s_n$ on the sum of squared errors. The key advantage of this method is that $s_n$ can be directly estimated from the data. We establish the uniform almost sure consistency of the proposed estimator and its subgradient over $\Omega$ as $n \rightarrow \infty$ and derive convergence rates. The effectiveness of our estimator is illustrated through its application to estimating waiting times in a single-server queue.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Convex Regression with a Penalty

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Comparison of neural network training strategies for the simulation of dynamical...

Informative missingness and its implications in semi-supervised learning

Recurrent Neural Networks with Linear Structures for Electricity Price Forecasti...

Control Consistency Losses for Diffusion Bridges

Foundations of Diffusion Models in General State Spaces: A Self-Contained Introd...

Навигация