📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
📄 A Graph Signal Processing Framework for Hallucination Detection in Large Language Models
2025-10-24Авторы:
Valentin Noël
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Large language models achieve impressive results but distinguishing factual
reasoning from hallucinations remains challenging. We propose a spectral
analysis framework that models transformer layers as dynamic graphs induced by
attention, with token embeddings as signals on these graphs. Through graph
signal processing, we define diagnostics including Dirichlet energy, spectral
entropy, and high-frequency energy ratios, with theoretical connections to
computational stability. Experiments across ...
Авторы:
Valentin Noël
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Different transformer architectures implement identical linguistic
computations via distinct connectivity patterns, yielding model imprinted
``computational fingerprints'' detectable through spectral analysis. Using
graph signal processing on attention induced token graphs, we track changes in
algebraic connectivity (Fiedler value, $\Delta\lambda_2$) under voice
alternation across 20 languages and three model families, with a prespecified
early window (layers 2--5). Our analysis uncovers clear a...
Авторы:
Keivan Faghih Niresi, Zepeng Zhang, Olga Fink
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Time series data are often affected by various forms of corruption, such as
missing values, noise, and outliers, which pose significant challenges for
tasks such as forecasting and anomaly detection. To address these issues,
inverse problems focus on reconstructing the original signal from corrupted
data by leveraging prior knowledge about its underlying structure. While deep
learning methods have demonstrated potential in this domain, they often require
extensive pretraining and struggle to gen...
Авторы:
Jiayi Huang, Sangwoo Park, Nicola Paoletti, Osvaldo Simeone
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Edge intelligence enables low-latency inference via compact on-device models,
but assuring reliability remains challenging. We study edge-cloud cascades that
must preserve conditional coverage: whenever the edge returns a prediction set,
it should contain the true label with a user-specified probability, as if
produced by the cloud model. We formalize conditional coverage with respect to
the cloud predictive distribution, and introduce a conformal alignment-based
(CAb) cascading mechanism that c...
Авторы:
Jinwen Xu, Qin Lu, Georgios B. Giannakis
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Uncertainty quantification (UQ) over graphs arises in a number of
safety-critical applications in network science. The Gaussian process (GP), as
a classical Bayesian framework for UQ, has been developed to handle
graph-structured data by devising topology-aware kernel functions. However,
such GP-based approaches are limited not only by the prohibitive computational
complexity, but also the strict modeling assumptions that might yield poor
coverage, especially with labels arriving on the fly. To ...
Авторы:
David R. Johnson, Rishabh Anand, Smita Krishnaswamy, Michael Perlmutter
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We introduce a novel version of the geometric scattering transform for
geometric graphs containing scalar and vector node features. This new
scattering transform has desirable symmetries with respect to rigid-body
roto-translations (i.e., $SE(3)$-equivariance) and may be incorporated into a
geometric GNN framework. We empirically show that our equivariant
scattering-based GNN achieves comparable performance to other equivariant
message-passing-based GNNs at a fraction of the parameter count.
📄 Bayesian autoregression to optimize temporal Matérn kernel Gaussian process hyperparameters
2025-08-15Авторы:
Wouter M. Kouw
## Контекст
Gaussian processes являются важной моделью в области проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы проблемы. Однако, оптимизация гиперпараметров ковариационной функции Матерна в таких моделях часто является нетривиальной задачей. Необходимость эффективных методов для восстановления этих гиперпараметров мотивирует разработку новых подходов.
## Метод
Предлагаемый подход основывается на использовании авторегрессионной модели для оптимизации гиперпараметров Матерна. Мы представляем гиперпараметры как параметры авторегрессионной модели, что позволяет применить байесовский подход для их оценки. Эта модель позволяет эффективно обрабатывать данные временных рядов, используя свойства Матерна.
## Результаты
Мы проводим эксперименты на основе реальных данных для сравнения предлагаемого подхода с двумя другими методами: оптимизацией максимальной вероятности и использованием Хаммильтоновского монте-карло. Результаты показывают, что предлагаемый подход демонстрирует лучшую скорость работы и более точные результаты в температурной оценке гиперпараметров Матерна.
## Значимость
Предлагаемый подход может быть применен во многих областях, где требуется прогнозировать временные ряды, таких как прогнозирование климата, мониторинг здоровья и финансовое моделирование. Он предлагает выгоды как в скорости работы, так и в точности.
## Выводы
Предлагаемый подход является эффективным для оптимизации гиперпараметров Матерна в задачах прогнозирования временных рядов. Будущие исследования будут ориентированы на расширение этого подхода для работы с более сложными моделями и данными.
Annotation:
Gaussian processes are important models in the field of probabilistic
numerics. We present a procedure for optimizing Mat\'ern kernel temporal
Gaussian processes with respect to the kernel covariance function's
hyperparameters. It is based on casting the optimization problem as a recursive
Bayesian estimation procedure for the parameters of an autoregressive model. We
demonstrate that the proposed procedure outperforms maximizing the marginal
likelihood as well as Hamiltonian Monte Carlo samplin...