Negative binomial regression and inference using a pre-trained transformer

2508.04111v1 stat.ML, cs.LG 2025-08-09

Авторы:

Valentine Svensson

Резюме на русском

#### Контекст Оценка параметров регрессии отрицательного биномиального распределения (Negative Binomial Regression, NBR) широко применяется в статистических исследованиях для анализа перекошенных распределений счётных данных. Однако в сценариях, требующих миллионов сравнений (таких как сравнение множества методик в машинном обучении), эта задача становится вычислительно трудоёмкой. Наиболее часто используемые методы оценки, такие как метод максимума вероятности (Maximum Likelihood Estimation, MLE), требуют вычисления многомерных интегралов, что замедляет работу на много раз. Имеются и другие методы, например, методы моментов, но их точность часто оставляет желать лучшего. Мы исследуем возможность использования предварительно обученной трансформерной модели для быстрого и точного вычисления параметров NBR. #### Метод Мы предлагаем использовать предварительно обученную модель, специально предназначенную для производства высокоточных оценок параметров NBR. Модель обучалась с помощью синтетических данных, генерирующихся с помощью случайных параметров NBR. Эта модель учитывает сложности в оценке NBR в масштабах миллионов сравнений. Мы изучаем, насколько хорошо эта модель может инвертировать процесс генерации данных и соответственно оценивать параметры. #### Результаты Мы провели эксперименты с различными размерами выборок и параметрами NBR. Наши результаты показали, что модель трансформера предоставляет более точные оценки параметров NBR по сравнению с MLE. Она работает 20 раз быстрее, что делает её привлекательной для высокомасштабных скринов, где быстрота критична. Однако методы моментов показали результаты, которые не уступают MLE в точности, но их вычислительная эффективность выше — они быстрее осуществляют оценки за тысячу раз меньше времени. #### Значимость Наше исследование открывает новые пути для эффективного анализа масштабных данных в сравнительных исследованиях. Использование предварительно обученных моделей трансформера позволяет ускорить работу, улучшить точность параметров и исключить необходимость в некоторых многомерных вычислениях. Это привлекательно для приложений в области машинного обучения, в том числе для обработки данных в ситуациях, когда требуется быстрота и точность. Однако методы моментов оказались более эффективными в сравнении, обеспечивая точность и быстроту, что делает их предпочтительным выбором в данной области. #### Выводы Мы успешно проверили модель трансформера для NBR, показав её преимущества в скорости и точности. Тем не менее, наше исследование также подчеркнуло значение методов моментов, которые

Abstract

Negative binomial regression is essential for analyzing over-dispersed count data in in comparative studies, but parameter estimation becomes computationally challenging in large screens requiring millions of comparisons. We investigate using a pre-trained transformer to produce estimates of negative binomial regression parameters from observed count data, trained through synthetic data generation to learn to invert the process of generating counts from parameters. The transformer method achieved better parameter accuracy than maximum likelihood optimization while being 20 times faster. However, comparisons unexpectedly revealed that method of moment estimates performed as well as maximum likelihood optimization in accuracy, while being 1,000 times faster and producing better-calibrated and more powerful tests, making it the most efficient solution for this application.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Negative binomial regression and inference using a pre-trained transformer

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Comparison of neural network training strategies for the simulation of dynamical...

Informative missingness and its implications in semi-supervised learning

Recurrent Neural Networks with Linear Structures for Electricity Price Forecasti...

Control Consistency Losses for Diffusion Bridges

Foundations of Diffusion Models in General State Spaces: A Self-Contained Introd...

Навигация