Gaussian Process Regression -- Neural Network Hybrid with Optimized Redundant Coordinates

2509.08457v1 stat.ML, cs.LG 2025-09-12
Авторы:

Sergei Manzhos, Manabu Ihara

Резюме на русском

## Контекст Гауссовский процесс (Gaussian Process, GP) является популярным методом для решения задач регрессии и классификации, основанного на теории вероятностей. Он представляет зависимость между переменными как гауссовское распределение, позволяя оценивать не только точные значения, но и их неопределенность. Однако, существуют проблемы, связанные с ограниченной способностью GP учитывать сложные нетривиальные зависимости, которые могут присутствовать в данных. Нейронные сети (Neural Networks, NN), наоборот, обладают высокой мощностью использования данных, но могут страдать от переобучения при недостаточном количестве обучающих примеров или избыточной моделирования. Мотивацией для разработки GPRNN-гибридного подхода служит необходимость объединить выразительную способность NN с гибкостью и надежностью GP, чтобы оптимизировать процесс обучения и получить более точные и устойчивые результаты. ## Метод GPRNN-гибрид основывается на использовании аддитивных ядер (additive kernels) GP в отношении реднидущих координат (redundant coordinates). Эти координаты, построенные по определенным правилам, позволяют представить высокомерные данные в низкомерные виды, упрощая работу модели. В этом исследовании предлагается оптимизировать эти координаты с помощью монте-карло-алгоритма (Monte Carlo algorithm). Архитектура системы включает нейросетевой слой, который обучается в сочетании с GP, чтобы улучшить точность и уменьшить вероятность переобучения. Эта архитектура рассматривается как улучшенная альтернатива глубоким нейронным сетям, когда многоуровневая модель может быть необязательной. ## Результаты Эксперименты проводились на различных задачах, таких как построение машинного обучения для интераторного потенциала и материаловедческие проблемы. Оценивались показатели качества, включая ошибку тестового набора (test set error) и степень переобучения. Результаты показали, что при использовании оптимизированных реднидущих координат (opt-GPRNN), модель достигла низкого уровня ошибок на тестовом наборе с значительно меньшим числом нейронов (или терминов) по сравнению с обычной GPRNN. Это позволило избежать переобучения при увеличении количества нейронов и улучшить производительность модели. Кроме того, оптимизация реднидущих координат позволила реализовать режим сжатия размерности данных, что делает модель еще более эффективной. ## Значимость Предлагаемый подход имеет широкие области применения, в том числе в машинном обучении, физике, химии и информатике. Наиболее выгодным является его применение там, где необходима высокая точность моделирования и низкая вероятность переобучения. Opt-GPRNN обладает потенциалом заменить глубокие нейронные с

Abstract

Recently, a Gaussian Process Regression - neural network (GPRNN) hybrid machine learning method was proposed, which is based on additive-kernel GPR in redundant coordinates constructed by rules [J. Phys. Chem. A 127 (2023) 7823]. The method combined the expressive power of an NN with the robustness of linear regression, in particular, with respect to overfitting when the number of neurons is increased beyond optimal. We introduce opt-GPRNN, in which the redundant coordinates of GPRNN are optimized with a Monte Carlo algorithm and show that when combined with optimization of redundant coordinates, GPRNN attains the lowest test set error with much fewer terms / neurons and retains the advantage of avoiding overfitting when the number of neurons is increased beyond optimal value. The method, opt-GPRNN possesses an expressive power closer to that of a multilayer NN and could obviate the need for deep NNs in some applications. With optimized redundant coordinates, a dimensionality reduction regime is also possible. Examples of application to machine learning an interatomic potential and materials informatics are given.

Ссылки и действия