Empirical PAC-Bayes bounds for Markov chains

2509.20985v1 stat.ML, cs.LG 2025-09-27
Авторы:

Vahe Karagulyan, Pierre Alquier

Резюме на русском

## Контекст Общая теория обобщаемости была сконцентрирована на независимых наблюдениях. Однако, в некоторых работах рассматриваются модели с временными зависимостями. Например, были разработаны PAC и PAC-Bayes бунды для таких случаев. Однако, эти бунды содержат константы, зависящие от свойств порождающего процесса, таких как миксинг-коэффициенты, миксинг-время, и спектральный лаг. Такие константы обычно неизвестны в практических задачах. Настоящая работа посвящена разработке нового PAC-Bayes бунда для Марковских цепей, который зависит от нового понятия - псевдо-спектрального лага. Наша главная новизна заключается в том, что мы можем вычислить эмпирическую оценку этого псевдо-спектрального лага в случае конечного состояния. Таким образом, мы получили первый полностью эмпирический PAC-Bayes бунд для Марковских цепей. Это расширение валидно не только для конечных пространств состояний, однако требуются дополнительные предположения. На эмпирических экспериментах, эмпирическая версия бунда оказалась почти такой же строгой, как и неэмпирическая. ## Метод Мы разработали новую теорему о PAC-Bayes бунде для Марковских цепей. Эта теорема основывается на новом понятии - псевдо-спектрального лага. Чтобы получить эмпирическую оценку этого псевдо-спектрального лага, мы использовали моделирование на конечных пространствах состояний. Для эмпирического приближения, мы использовали теорию Марковских цепей, обобщенную на временные зависимости. Эта модель позволяет получить бунд, который зависит от псевдо-спектрального лага, но не требует предварительного знания свойств порождающего процесса. Мы также разработали симуляционные эксперименты, позволяющие проверить точность полученного бунда. ## Результаты Мы провели эксперименты на симуляционных данных с конечным пространством состояний. Наши результаты показали, что эмпирический PAC-Bayes бунд оказался почти такой же строгим, как и неэмпирический. Это задает новый подход к оценке обобщаемости для Марковских цепей, когда нет доступа к константам, зависящим от свойств процесса. Были получены результаты, подтверждающие эффективность псевдо-спектрального лага в качестве меры зависимости в Марковских цепях. Эти результаты могут быть применены в машинном обучении и других областях, где используются временные зависимости. ## Значимость Наша работа имеет значительное значение для области обобщаемости в нейронных сетях и вычислительной теории. Наш бунд может быть применен в задачах, где тре

Abstract

The core of generalization theory was developed for independent observations. Some PAC and PAC-Bayes bounds are available for data that exhibit a temporal dependence. However, there are constants in these bounds that depend on properties of the data-generating process: mixing coefficients, mixing time, spectral gap... Such constants are unknown in practice. In this paper, we prove a new PAC-Bayes bound for Markov chains. This bound depends on a quantity called the pseudo-spectral gap. The main novelty is that we can provide an empirical bound on the pseudo-spectral gap when the state space is finite. Thus, we obtain the first fully empirical PAC-Bayes bound for Markov chains. This extends beyond the finite case, although this requires additional assumptions. On simulated experiments, the empirical version of the bound is essentially as tight as the non-empirical one.

Ссылки и действия