Gaussian Process Regression -- Neural Network Hybrid with Optimized Redundant Coordinates
2509.08457v1
stat.ML, cs.LG
2025-09-12
Авторы:
Sergei Manzhos, Manabu Ihara
Резюме на русском
## Контекст
Гауссовский процесс (Gaussian Process, GP) является популярным методом для решения задач регрессии и классификации, основанного на теории вероятностей. Он представляет зависимость между переменными как гауссовское распределение, позволяя оценивать не только точные значения, но и их неопределенность. Однако, существуют проблемы, связанные с ограниченной способностью GP учитывать сложные нетривиальные зависимости, которые могут присутствовать в данных. Нейронные сети (Neural Networks, NN), наоборот, обладают высокой мощностью использования данных, но могут страдать от переобучения при недостаточном количестве обучающих примеров или избыточной моделирования. Мотивацией для разработки GPRNN-гибридного подхода служит необходимость объединить выразительную способность NN с гибкостью и надежностью GP, чтобы оптимизировать процесс обучения и получить более точные и устойчивые результаты.
## Метод
GPRNN-гибрид основывается на использовании аддитивных ядер (additive kernels) GP в отношении реднидущих координат (redundant coordinates). Эти координаты, построенные по определенным правилам, позволяют представить высокомерные данные в низкомерные виды, упрощая работу модели. В этом исследовании предлагается оптимизировать эти координаты с помощью монте-карло-алгоритма (Monte Carlo algorithm). Архитектура системы включает нейросетевой слой, который обучается в сочетании с GP, чтобы улучшить точность и уменьшить вероятность переобучения. Эта архитектура рассматривается как улучшенная альтернатива глубоким нейронным сетям, когда многоуровневая модель может быть необязательной.
## Результаты
Эксперименты проводились на различных задачах, таких как построение машинного обучения для интераторного потенциала и материаловедческие проблемы. Оценивались показатели качества, включая ошибку тестового набора (test set error) и степень переобучения. Результаты показали, что при использовании оптимизированных реднидущих координат (opt-GPRNN), модель достигла низкого уровня ошибок на тестовом наборе с значительно меньшим числом нейронов (или терминов) по сравнению с обычной GPRNN. Это позволило избежать переобучения при увеличении количества нейронов и улучшить производительность модели. Кроме того, оптимизация реднидущих координат позволила реализовать режим сжатия размерности данных, что делает модель еще более эффективной.
## Значимость
Предлагаемый подход имеет широкие области применения, в том числе в машинном обучении, физике, химии и информатике. Наиболее выгодным является его применение там, где необходима высокая точность моделирования и низкая вероятность переобучения. Opt-GPRNN обладает потенциалом заменить глубокие нейронные с
Abstract
Recently, a Gaussian Process Regression - neural network (GPRNN) hybrid
machine learning method was proposed, which is based on additive-kernel GPR in
redundant coordinates constructed by rules [J. Phys. Chem. A 127 (2023) 7823].
The method combined the expressive power of an NN with the robustness of linear
regression, in particular, with respect to overfitting when the number of
neurons is increased beyond optimal. We introduce opt-GPRNN, in which the
redundant coordinates of GPRNN are optimized with a Monte Carlo algorithm and
show that when combined with optimization of redundant coordinates, GPRNN
attains the lowest test set error with much fewer terms / neurons and retains
the advantage of avoiding overfitting when the number of neurons is increased
beyond optimal value. The method, opt-GPRNN possesses an expressive power
closer to that of a multilayer NN and could obviate the need for deep NNs in
some applications. With optimized redundant coordinates, a dimensionality
reduction regime is also possible. Examples of application to machine learning
an interatomic potential and materials informatics are given.
Ссылки и действия
Дополнительные ресурсы: