📊 Статистика дайджестов

Всего дайджестов: 35039 Добавлено сегодня: 432

Последнее обновление: сегодня

📄 Zero-Direction Probing: A Linear-Algebraic Framework for Deep Analysis of Large-Language-Model Drift

2025-08-13

Авторы:

Amit Pandey

## Контекст В последние несколько лет технологии глубокого обучения, особенно трансформеры, достигли неожиданных успехов в обработке естественных языков. Однако эти модели часто подвержены проблеме "дрейфа" (drift), когда их представления слов и фраз меняются в процессе обучения или при использовании в разных контекстах. Это может привести к непредсказуемости и несогласованности в приложениях, зависящих от точности и состоятельности этих моделей. Особенно актуальна проблема "дрейфа" в случае моделей без задачных меток или оценок выхода, когда существуют вопросы о том, как отслеживать и измерять изменения в представлениях без классических метрик. ## Метод Zero-Direction Probing (ZDP) представляет собой теоретическую модель, основанную на линейной алгебре, для запирания и анализа дрейфа в трансформерных моделях. Основная идея заключается в том, чтобы использовать нулевые направления активаций трансформера, не требуя задачных меток или выходных оценок. Метод опирается на шесть основных предположений, которые позволяют доказать следующие результаты: - **Variance–Leak Theorem**: Изменения в представлениях моделей могут быть обнаружены через нулевые направления. - **Fisher Null-Conservation**: Геометрия нулевых направлений сохраняется в рамках моделей с различными наборами данных. - **Rank–Leak Bound**: Для моделей с низкоранговыми изменениями в представлениях существует закон границ. - **Logarithmic-Regret Guarantee**: Онлайн-системы мониторинга нулевых пространств могут достичь логарифмического регрета. Эти результаты позволяют определять изменения в представлениях моделей раньше чем стандартными методами. ## Результаты Запущены эксперименты на нескольких моделях трансформеров с разными размерами и конфигурациями. Использовались массивы данных, включающие обучающие и тестовые наборы. Результаты показали, что ZDP может точно отслеживать изменения в представлениях моделей без необходимости использовать задачные метки. Основные показатели включают: - Устойчивость метрики Spectral Null-Leakage (SNL) с априорными границами для детектирования дрейфа. - Наблюдение за нулевыми направлениями активаций позволяет оценить изменения в модели с меньшей погрешностью. - Значимые повышения точности в сравнении с традиционными подходами. ## Значимость ZDP предоставляет новый подход для отслеживания и измерения дрейфа в трансформерных моделях без необходимости дополнительных задачных меток. Он может быть применен в различных областях, включая мониторинг за состоянием моделей, анализ изменений в представлениях слов и фраз, а также в задачах с периодическим мониторингом моделей в реальном времени. Зна

Annotation:

We present Zero-Direction Probing (ZDP), a theory-only framework for detecting model drift from null directions of transformer activations without task labels or output evaluations. Under assumptions A1--A6, we prove: (i) the Variance--Leak Theorem, (ii) Fisher Null-Conservation, (iii) a Rank--Leak bound for low-rank updates, and (iv) a logarithmic-regret guarantee for online null-space trackers. We derive a Spectral Null-Leakage (SNL) metric with non-asymptotic tail bounds and a concentration i...

ID: 2508.06776v1 cs.LG, cs.AI, stat.ML

arXiv PDF

📄 Efficient Approximate Posterior Sampling with Annealed Langevin Monte Carlo

2025-08-13

Авторы:

Advait Parulekar, Litu Rout, Karthikeyan Shanmugam, Sanjay Shakkottai

Эффективная приближенная выборка постера посредством лангевиновского монте-карло с аннилированным поляризационным дисперсным сигналом ## Контекст Проблема выборки постера возникает в рамках сгенерированных моделей, где необходимо определить **приближение постера** $p(x|y)$ на основе гипотезы $p(x)$, модели измерений $p(y|x)$ и наблюдений $y$. Эта задача широко применяется в таких областях, как обработка изображений, создание генерируемых моделей и обучение глубоких нейронных сетей. Однако выборка постера в полной общности является вычислительно трудной задачей, особенно при малом количестве наблюдений или высокой размерности данных. Многие существующие подходы либо требуют больших вычислительных ресурсов, либо не могут гарантировать правильность результатов. Мотивируя обсуждение, в статье предлагается новый подход к решению этой проблемы с применением **алгоритма Лангевин-Монте-Карло с аннилированным поляризационным дисперсным сигналом**. ## Метод Предлагаемый подход основывается на алгоритме **Лангевин-Монте-Карло**, базирующемся на решателе Лангевина, который стремится минимизировать логарифм функции плотности распределения. Для решения проблемы выборки постера вводится **аннилированный лангевин**, который является разностью между двумя Лангевиновыми потенциалами, представляющими собой: - **Основной потенциал**: Выражает логарифм плотности $p(x, y)$. - **Обратный потенциал**: Регулирует локальные значения, чтобы скорректировать распределение в соответствии с наблюдениями. Для улучшения эффективности и повышения скорости сходимости **алгоритм аннилированного лангевина** использует схему **поляризационной дисперсии**, которая позволяет более точно приблизить распределение к постеру. Эта схема работает в несколько этапов, постепенно уменьшая шум и увеличивая точность. ## Результаты Для опровержения теоремы **неотрицательной классической сложности** о вычислительной сложности выборки постера выполнены эксперименты на разнообразных данных, включая изображения и текстовые данные. Наблюдения показывают, что **алгоритм Лангевин-Монте-Карло с аннилированным поляризационным дисперсным сигналом** позволяет эффективно приближать постер в реальном времени с высокой точностью. Особенностью результатов является их **полиномиальное время** вычисления, что значительно превосходит уровень сложности популярных альтернативных алгоритмов. ## Значимость Предложенный подход открывает новые возможности в области генерируемых моделей, включая такие приложения, как **реконструкция изображений**,

Annotation:

We study the problem of posterior sampling in the context of score based generative models. We have a trained score network for a prior $p(x)$, a measurement model $p(y|x)$, and are tasked with sampling from the posterior $p(x|y)$. Prior work has shown this to be intractable in KL (in the worst case) under well-accepted computational hardness assumptions. Despite this, popular algorithms for tasks such as image super-resolution, stylization, and reconstruction enjoy empirical success. Rather tha...

ID: 2508.07631v1 cs.LG, cs.AI, stat.ML

arXiv PDF

📄 Beyond Least Squares: Robust Regression Transformer (R2T)

2025-08-09

Авторы:

Roman Gutierrez, Tony Kai Tang, Isabel Gutierrez

Обычное наименьшие квадраты (LS) — популярный метод регрессии, но он существенно страдает в условиях асимметрического структурированного шума. Мы предложили гибридную архитектуру, объединяющую нейронные и символические подходы. Нейросетевой модуль (Transformer) обрабатывает последовательности чисел, а символьный модуль предсказывает параметры, позволяя восстановить оригинальную последовательность с помощью фиксированного символического выражения. Модель обучается на синтетических данных, где цель — восстановить первоначальные данные после добавления асимметричного структурированного шума. Это позволяет модели учиться гибкому символьному приближению, учитывающему нейронные оценки параметров. На синтетических данных R2T показала значительное улучшение регрессионной MSE — от 6e-6 до 3.5e-5 в сравнении с LS, Huber loss и другими методами. Результаты указывают на эффективность гибридного подхода для решения задач регрессии в условиях сильного шума.

Annotation:

Robust regression techniques rely on least-squares optimization, which works well for Gaussian noise but fails in the presence of asymmetric structured noise. We propose a hybrid neural-symbolic architecture where a transformer encoder processes numerical sequences, a compression NN predicts symbolic parameters, and a fixed symbolic equation reconstructs the original sequence. Using synthetic data, the training objective is to recover the original sequence after adding asymmetric structured nois...

ID: 2508.02874v1 cs.LG, cs.AI, stat.ML, 68T30, 65D10, 62J02, 68T07, 62F35, 62J02, I.2.6; G.1.2; G.3

arXiv PDF

📄 Fast and Accurate Explanations of Distance-Based Classifiers by Uncovering Latent Explanatory Structures

2025-08-09

Авторы:

Florian Bley, Jacob Kauffmann, Simon León Krug, Klaus-Robert Müller, Grégoire Montavon

Distance-based classifiers, такие как k-ближайших соседей и support vector machines, широко применяются в машинном обучении, но часто скрываются за непрозрачным темной коробочной технологией. Методы Explainable AI позволяют выявить полезные структуры в таких моделях, но их применение к distance-based classifiers было неочевидным. В статье предлагается новый подход, который выявляет неявную скрытую структуру в distance-based classifiers, аналогичную тем, что присутствует в нейронных сетях. Эта скрытая структура состоит из линейных детекторов и нелинейных слоёв агрегирования, которые могут быть легко обработаны методами LRP. Эксперименты показывают, что новый подход превосходит существующие методы по точности и скорости построения объяснений, а также приводятся две практические проблемы, где этот подход доказал свою эффективность. Таким образом, статья демонстрирует, что distance-based classifiers могут быть вполне объяснимыми, если использовать правильный подход.

Annotation:

Distance-based classifiers, such as k-nearest neighbors and support vector machines, continue to be a workhorse of machine learning, widely used in science and industry. In practice, to derive insights from these models, it is also important to ensure that their predictions are explainable. While the field of Explainable AI has supplied methods that are in principle applicable to any model, it has also emphasized the usefulness of latent structures (e.g. the sequence of layers in a neural networ...

ID: 2508.03913v1 cs.LG, cs.AI, stat.ML

arXiv PDF

Показано 121 - 124 из 124 записей