Hi-fi functional priors by learning activations

2508.08880v1 cs.LG, stat.ML 2025-08-14

Авторы:

Marcin Sendera, Amin Sorkhei, Tomasz Kuśmierczyk

Резюме на русском

#### Контекст Байесовские нейронные сети (BNNs) представляют собой мощный инструмент для анализа данных, позволяя учесть неопределенность в прогностических моделях. Одной из ключевых задач в их развитии является реализация функциональных представлений, которые позволяют эффективно управлять регуляризацией, оценкой неопределенности и выбором рисков. Однако, внедрение таких представлений в модели часто становится сложной задачей из-за необходимости добиться баланса между гибкостью и стабильностью. Мы рассматриваем новый подход, основанный на оптимизации тренируемых активаций, чтобы лучше подстроиться под высоко-комплексные функциональные представления. #### Метод Мы предлагаем метод, основанный на оптимизации тренируемых активаций в BNNs, чтобы поддерживать функциональные представления. Наше решение включает в себя использование таких функций, как Pade и piecewise linear, которые дают более гибкий и точный способ задавать функциональные представления. Мы также уделяем внимание проблемам, таким как идентификабельность, конструкция потерь и симметрии, которые могут влиять на эффективность. Наш подход основывается на том, что даже простейшие архитектуры BNNs, содержащие один широкий слой, когда используют тренируемые активации, могут достигать желаемого уровня функциональной точности. #### Результаты Мы провели эксперименты, используя различные данные и сравнили их с традиционными подходами. Наши результаты показали, что даже простые BNNs могут достигать высокой точности при условии использования тренируемых активаций. Мы также изучили различные варианты функциональных представлений и оценили их влияние на регуляризацию и неопределенность. Эти результаты указывают на то, что наше решение может стать эффективным инструментом для усовершенствования BNNs. #### Значимость Наш подход может быть применен в сферах, где важно учитывать неопределенность, таких как медицина, финансы и автоматизация. Ключевым преимуществом является улучшение регуляризации и оценки неопределенности, что может привести к более надежным и точным прогнозам. Этот подход также может иметь большой потенциал в области глубокого обучения, где необходимо контролировать и управлять неопределенностью в результатах. #### Выводы Мы успешно продемонстрировали, что тренируемые активации могут быть эффективно использованы для реализации функциональных представлений в BNNs. Наш подход демонстрирует более гибкую и точную стратегию для управления неопределенностью и регуляризацией. Мы планируем продолжать расследовать возможности этого под

Abstract

Function-space priors in Bayesian Neural Networks (BNNs) provide a more intuitive approach to embedding beliefs directly into the model's output, thereby enhancing regularization, uncertainty quantification, and risk-aware decision-making. However, imposing function-space priors on BNNs is challenging. We address this task through optimization techniques that explore how trainable activations can accommodate higher-complexity priors and match intricate target function distributions. We investigate flexible activation models, including Pade functions and piecewise linear functions, and discuss the learning challenges related to identifiability, loss construction, and symmetries. Our empirical findings indicate that even BNNs with a single wide hidden layer when equipped with flexible trainable activation, can effectively achieve desired function-space priors.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Hi-fi functional priors by learning activations

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Breaking Determinism: Stochastic Modeling for Reliable Off-Policy Evaluation in ...

Tuning-Free Structured Sparse Recovery of Multiple Measurement Vectors using Imp...

GaussDetect-LiNGAM:Causal Direction Identification without Gaussianity test

Parameter-Efficient Augment Plugin for Class-Incremental Learning

Mitigating the Curse of Detail: Scaling Arguments for Feature Learning and Sampl...

Навигация