Stochastic Gradients under Nuisances

2508.20326v1 stat.ML, cs.LG, math.OC 2025-08-29
Авторы:

Facheng Yu, Ronak Mehta, Alex Luedtke, Zaid Harchaoui

Резюме на русском

## Контекст Область исследования связана с методами стохастического градиентного оптимизации, которые широко используются в различных сферах, от классического машинного обучения до современных подходов в области самостоятельного обучения. Одна из проблем в этой области заключается в том, что некоторые обучающие процессы зависят от неизвестных нюансов (nuisances), которые могут затруднять достижение оптимальных результатов. Мотивацией для данных исследований является развитие методов, позволяющих стохастическим градиентным алгоритмам достигать хороших результатов даже при наличии таких нюансов. ## Метод Авторы предлагают рассмотреть стохастические градиентные алгоритмы в ситуациях, когда оптимизируемый функционал зависит от неизвестных нюансов. Они исследуют условия, при которых данные алгоритмы могут по-прежнему достигать приемлемых результатов. Особое внимание уделено понятию Neyman-ортогональности, которое позволяет оценить влияние нюансов на оптимизационный процесс. Кроме того, предложена разработка вариантов алгоритмов с приближенно ортогональными обновлениями, которые могут компенсировать влияние нюансов и поддерживать близкие к классическим стохастическим градиентам результаты. ## Результаты Исследования проводились с использованием синтетических и реальных данных. Авторы проверили эффективность своих методов на примерах из области статистического обучения и двойного машинного обучения. Для оценки производительности использовались метрики, такие как скорость сходимости и точность решения. Результаты показали, что при удовлетворении условия Neyman-ортогональности стохастические градиенты могут достичь оптимальных результатов. В случае, когда условие не выполняется, вариант с приближенно ортогональными обновлениями показал приемлемые результаты, уменьшая влияние нюансов на оптимизацию. ## Значимость Предложенные методы могут применяться в ситуациях, когда задачи обучения зависят от неизвестных нюансов. Они демонстрируют высокую потенциальную полезность в области самостоятельного обучения, обработки нестандартных данных и двойного машинного обучения. Основное преимущество заключается в улучшении устойчивости и эффективности стохастических градиентных алгоритмов при оптимизации задач, где нюансы могут существенно повлиять на результаты. Это может привести к более надежным и предсказуемым результатам в различных практических сценариях. ## Выводы Изучение влияния нюансов на стохастические градиентные алгоритмы позволило установить условия, при которых данные алгоритмы все же могут достичь приемлемых результатов

Abstract

Stochastic gradient optimization is the dominant learning paradigm for a variety of scenarios, from classical supervised learning to modern self-supervised learning. We consider stochastic gradient algorithms for learning problems whose objectives rely on unknown nuisance parameters, and establish non-asymptotic convergence guarantees. Our results show that, while the presence of a nuisance can alter the optimum and upset the optimization trajectory, the classical stochastic gradient algorithm may still converge under appropriate conditions, such as Neyman orthogonality. Moreover, even when Neyman orthogonality is not satisfied, we show that an algorithm variant with approximately orthogonalized updates (with an approximately orthogonalized gradient oracle) may achieve similar convergence rates. Examples from orthogonal statistical learning/double machine learning and causal inference are discussed.

Ссылки и действия