Hi-fi functional priors by learning activations
2508.08880v1
cs.LG, stat.ML
2025-08-14
Авторы:
Marcin Sendera, Amin Sorkhei, Tomasz Kuśmierczyk
Резюме на русском
#### Контекст
Байесовские нейронные сети (BNNs) представляют собой мощный инструмент для анализа данных, позволяя учесть неопределенность в прогностических моделях. Одной из ключевых задач в их развитии является реализация функциональных представлений, которые позволяют эффективно управлять регуляризацией, оценкой неопределенности и выбором рисков. Однако, внедрение таких представлений в модели часто становится сложной задачей из-за необходимости добиться баланса между гибкостью и стабильностью. Мы рассматриваем новый подход, основанный на оптимизации тренируемых активаций, чтобы лучше подстроиться под высоко-комплексные функциональные представления.
#### Метод
Мы предлагаем метод, основанный на оптимизации тренируемых активаций в BNNs, чтобы поддерживать функциональные представления. Наше решение включает в себя использование таких функций, как Pade и piecewise linear, которые дают более гибкий и точный способ задавать функциональные представления. Мы также уделяем внимание проблемам, таким как идентификабельность, конструкция потерь и симметрии, которые могут влиять на эффективность. Наш подход основывается на том, что даже простейшие архитектуры BNNs, содержащие один широкий слой, когда используют тренируемые активации, могут достигать желаемого уровня функциональной точности.
#### Результаты
Мы провели эксперименты, используя различные данные и сравнили их с традиционными подходами. Наши результаты показали, что даже простые BNNs могут достигать высокой точности при условии использования тренируемых активаций. Мы также изучили различные варианты функциональных представлений и оценили их влияние на регуляризацию и неопределенность. Эти результаты указывают на то, что наше решение может стать эффективным инструментом для усовершенствования BNNs.
#### Значимость
Наш подход может быть применен в сферах, где важно учитывать неопределенность, таких как медицина, финансы и автоматизация. Ключевым преимуществом является улучшение регуляризации и оценки неопределенности, что может привести к более надежным и точным прогнозам. Этот подход также может иметь большой потенциал в области глубокого обучения, где необходимо контролировать и управлять неопределенностью в результатах.
#### Выводы
Мы успешно продемонстрировали, что тренируемые активации могут быть эффективно использованы для реализации функциональных представлений в BNNs. Наш подход демонстрирует более гибкую и точную стратегию для управления неопределенностью и регуляризацией. Мы планируем продолжать расследовать возможности этого под
Abstract
Function-space priors in Bayesian Neural Networks (BNNs) provide a more
intuitive approach to embedding beliefs directly into the model's output,
thereby enhancing regularization, uncertainty quantification, and risk-aware
decision-making. However, imposing function-space priors on BNNs is
challenging. We address this task through optimization techniques that explore
how trainable activations can accommodate higher-complexity priors and match
intricate target function distributions. We investigate flexible activation
models, including Pade functions and piecewise linear functions, and discuss
the learning challenges related to identifiability, loss construction, and
symmetries. Our empirical findings indicate that even BNNs with a single wide
hidden layer when equipped with flexible trainable activation, can effectively
achieve desired function-space priors.
Ссылки и действия
Дополнительные ресурсы: