📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
Авторы:
Louise AC Millard, Peter A Flach
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Classification models typically predict a score and use a decision threshold
to produce a classification. Appropriate model evaluation should carefully
consider the context in which a model will be used, including the relative
value of correct classifications of positive versus negative examples, which
affects the threshold that should be used. Decision curve analysis (DCA) and
cost curves are model evaluation approaches that assess the expected utility
and expected loss of prediction models, re...
Авторы:
Alessandro Manenti, Cesare Alippi
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Latent categorical variables are frequently found in deep learning
architectures. They can model actions in discrete reinforcement-learning
environments, represent categories in latent-variable models, or express
relations in graph neural networks. Despite their widespread use, their
discrete nature poses significant challenges to gradient-descent learning
algorithms. While a substantial body of work has offered improved gradient
estimation techniques, we take a complementary approach. Specifica...
Авторы:
Zhijian Xu, Wanxu Cai, Xilin Dai, Zhaorong Deng, Qiang Xu
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The evaluation of time series forecasting models is hindered by a critical
lack of high-quality benchmarks, leading to a potential illusion of progress.
Existing datasets suffer from issues ranging from pre-training data
contamination in the age of LLMs to the causal and description leakage
prevalent in early multimodal designs. To address this, we formalize the core
principles of high-fidelity benchmarking, focusing on data sourcing integrity,
strict causal soundness, and structural clarity. We...
Авторы:
Sahana Rayan, Yash Patel, Ambuj Tewari
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
When solving PDEs, classical numerical solvers are often computationally
expensive, while machine learning methods can suffer from spectral bias,
failing to capture high-frequency components. Designing an optimal hybrid
iterative solver--where, at each iteration, a solver is selected from an
ensemble of solvers to leverage their complementary strengths--poses a
challenging combinatorial problem. While the greedy selection strategy is
desirable for its constant-factor approximation guarantee to t...
Авторы:
Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The conditional average treatment effect (CATE) is widely used in
personalized medicine to inform therapeutic decisions. However,
state-of-the-art methods for CATE estimation (so-called meta-learners) often
perform poorly in the presence of low overlap. In this work, we introduce a new
approach to tackle this issue and improve the performance of existing
meta-learners in the low-overlap regions. Specifically, we introduce
Overlap-Adaptive Regularization (OAR) that regularizes target models
propo...
Авторы:
Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler, Amartya Sanyal
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
As machine learning systems increasingly train on self-annotated data, they
risk reinforcing errors and becoming echo chambers of their own beliefs. We
model this phenomenon by introducing a learning-theoretic framework: Online
Learning in the Replay Setting. In round $t$, the learner outputs a hypothesis
$\hat{h}_t$; the adversary then reveals either the true label $f^\ast(x_t)$ or
a replayed label $\hat{h}_i(x_t)$ from an earlier round $i < t$. A mistake is
counted only when the true label is ...
📄 Bandits roaming Hilbert space
2025-10-01Авторы:
Josep Lumbreras
## Контекст
Изучение торговли с большим числом параметров (multi-armed bandits) широко распространено в машинном обучении и применяется для решения задач, где необходимо балансировать исследование (exploration) и использование накопленной информации (exploitation). В этой работе автор рассматривает применение многоруких бандитов для изучения свойств квантовых состояний с помощью онлайн-методов. Он отмечает, что существующие подходы к изучению квантовых состояний часто требуют большого количества измерений, что может повлечь деструктивное воздействие на состояние. Идея заключается в использовании многоруких бандитов для оптимизации измерений и сокращения количества необходимых измерений для получения точных оценок свойств квантовых состояний.
## Метод
Работа опирается на методику многоруких бандитов с оптимизацией значений ожидания. Автор использует методы, основанные на оптимистической логике, которые позволяют контролировать значения ожидания в основе выбора действий. Он разрабатывает алгоритмы, которые используют оптимистическую инициализацию для уменьшения регрета (суммарного отличия между текущим результатом и максимально возможным). Этот подход используется для переформулировки задачи томографии квантовых состояний и для оптимизации измерения в рамках теории информации.
## Результаты
Автор проверяет свой подход на различных ситуациях: для изучения чистого квантового состояния, для рекомендательных систем квантовых систем, а также для извлечения работы из квантовых состояний. В качестве теста используются различные структуры данных, включая дискретные и непрерывные диапазоны. Он показывает, что регрет масштабируется как квадратный корень от числа итераций, что демонстрирует эффективность подхода. Более того, применение этого подхода к томографии квантовых состояний позволяет эффективно измерять состояние с минимальным воздействием на него.
## Значимость
Предложенный подход может быть применен в оптимизации измерений в квантовой томографии, эффективном извлечении работы из квантовых состояний и в построении рекомендательных систем квантовых систем. Он обеспечивает эффективное уменьшение числа измерений, что критически важно для квантовых систем, где каждое измерение может повредить состояние. Этот подход также может иметь широкое применение в области машинного обучения, где необходимо балансировать исследование и использование накопленной информации.
## Выводы
Работа показывает, что многорукие бандиты могут эффективно применяться для изучения квантовых состояний, уменьшая количество измерений и оптимизируя получение информации. Будущие исследования могут сосредоточиться на расширении этого
Annotation:
This thesis studies the exploration and exploitation trade-off in online
learning of properties of quantum states using multi-armed bandits. Given
streaming access to an unknown quantum state, in each round we select an
observable from a set of actions to maximize its expectation value. Using past
information, we refine actions to minimize regret; the cumulative gap between
current reward and the maximum possible. We derive information-theoretic lower
bounds and optimal strategies with matching ...
Авторы:
Siwei Wang, Yifei Shen, Haoran Sun, Shi Feng, Shang-Hua Teng, Li Dong, Yaru Hao, Wei Chen
## Контекст
Недавние развития в области глубокого обучения и реинфорсментного обучения (RL) позволили значительно улучшить планировочные возможности больших языковых моделей (LLM). Однако теоретическая природа этих улучшений остается не полностью понятной. В данной работе мы проводим исследование преимуществ и ограничений RL с помощью графовой абстракции, которая позволяет изучить ситуации, где RL может быть эффективным, а также где могут возникнуть проблемы. Эта модель позволяет сравнивать методы RL, таких как policy gradient (PG) и Q-learning, с другими моделями, такими как предварительно приточенные (supervised fine-tuned, SFT) модели, и выявлять преимущества и недостатки каждого подхода.
## Метод
В этой работе используется графовая абстракция, которая представляет задачи планирования в виде состояний и действий на графе. Мы изучаем, как RL-методы, такие как PG и Q-learning, взаимодействуют с этой абстракцией и как они могут решать задачи планирования. Мы также проводим сравнение с SFT-моделями, которые обучаются с помощью Supervised Learning. Затем мы проводим эксперименты, используя реальные задачи планирования, такие как Blocksworld, в которых мы можем сравнить результаты настоящих данных с теоретическими выводами.
## Результаты
Наши эксперименты показали, что SFT может привести к проблеме спуруосных решений, которые возникают из-за взаимосвязи входных данных, но не всегда корректно решают задачу планирования. RL, в свою очередь, более эффективно решает эти задачи, особенно благодаря эксплорерским поведениям, которые позволяют RL-системам улучшать свою общезначимость. Однако мы также выявили, что PG может привести к "уплотнению диверсификации" (diversity collapse), когда диверсификация решений уменьшается на протяжении обучения, даже если система достигает идеальной точности. Мы также показали, как Q-learning может стать более диверсифицированной, но только при условии правильного дизайна наград.
## Значимость
Наши результаты имеют значительное значение для развития RL в области планирования языковых моделей. Мы показали, что RL может быть эффективным для решения задач планирования, но необходимо внимательно проектировать наградные функции для избежания проблем, таких как "уплотнение диверсификации". Мы также показали, что Q-learning может показаться более гибким и диверсифицированным в контексте RL. Эти результаты могут быть применены в различных областях, где требуется планирование и проектирование решений, таких как машинное обучение, игровые системы и управление.
## Выводы
Мы получили значительные теоретические и практические выводы о преимуществах и ограничениях RL в задачах планирования. Мы выявили, что RL мо
Annotation:
Recent reinforcement learning (RL) methods have substantially enhanced the
planning capabilities of Large Language Models (LLMs), yet the theoretical
basis for their effectiveness remains elusive. In this work, we investigate
RL's benefits and limitations through a tractable graph-based abstraction,
focusing on policy gradient (PG) and Q-learning methods. Our theoretical
analyses reveal that supervised fine-tuning (SFT) may introduce
co-occurrence-based spurious solutions, whereas RL achieves co...
Авторы:
Scott Koermer, Natalie Klein
## Контекст
Байесовские нейронные сети (BNN) — один из самых мощных подходов к оценке неопределённости в моделях машинного обучения. Они позволяют моделировать не только прогнозы, но и уровень неопределённости, связанный с весами сети. Это ключевой фактор для применения BNN в сценариях, требующих высокой надежности и точности оценки неопределённости, таких как клинические диагностики, финансовые прогнозы или анализ экстремальных ситуаций. Однако успешное применение BNN ограничивается трудностями в настройке многообразия гиперпараметров, влияющих на качество прогнозов и эффективность неопределённости. Недостаток понимания взаимосвязи этих гиперпараметров приводит к нередкой ситуации, когда модели, хотя и демонстрируют высокую точность, не обеспечивают достаточного уровня неопределённости, что может привести к ошибочным выводам в решениях.
## Метод
Мы применяем метод анализа чувствительности для исследования влияния различных гиперпараметров BNN на процесс обучения и результаты моделирования. Исходные данные, используемые в экспериментах, содержат искусственные и реальные ситуации, включая задачи классификации и регрессии. Для сравнения мы используем типичные гиперпараметры, такие как размер сети, скорость обучения, моменты и параметры регуляризации. Метод анализа чувствительности позволяет определить, какие гиперпараметры имеют наибольшее влияние на результат, а также выяснить степень взаимодействия этих параметров.
## Результаты
Наши эксперименты показали, что многие гиперпараметры имеют сильно взаимосвязанное воздействие друг на друга. Например, увеличение размера сети может улучшить точность прогноза, но при этом ухудшить неопределённость. Также мы обнаружили, что наиболее влиятельными гиперпараметрами являются скорость обучения и моменты. Наблюдалось, что неправильная настройка этих параметров может привести к снижению качества модели в целом. Также мы обнаружили, что некоторые комбинации гиперпараметров могут привести к неожиданным результатам, в частности, к ухудшению неопределённости без улучшения точности прогнозов.
## Значимость
Полученные результаты имеют большую значимость для практического применения BNN в реальных задачах. Они подтверждают, что для достижения качественных результатов необходимо использовать специальные методы, такие как глобальный анализ чувствительности или байесовская оптимизация, для оптимальной настройки гиперпараметров. Эти методы позволяют уменьшить меру неопределённости, обеспечивая точные прогнозы и упрощая выбор гиперпараметров. Более то
Annotation:
In scientific applications, predictive modeling is often of limited use
without accurate uncertainty quantification (UQ) to indicate when a model may
be extrapolating or when more data needs to be collected. Bayesian Neural
Networks (BNNs) produce predictive uncertainty by propagating uncertainty in
neural network (NN) weights and offer the promise of obtaining not only an
accurate predictive model but also accurate UQ. However, in practice, obtaining
accurate UQ with BNNs is difficult due in pa...
Авторы:
Feiyang Fu, Tongxian Guo, Zhaoqiang Liu
#### Контекст
Discrete diffusion models (DDMs) представляют собой мощные методы для генерации данных в дискретных модальностях, таких как текст и молекулы. Однако их практическое применение существенно ограничено неэффективностью процесса семплирования, требующим большого числа шагов. За счет увеличения шага семплирования можно ускорить процесс, однако это приводит к серьезным проблемам в генерируемых данных. Такие проблемы включают ускорение суммарного ошибки декодирования из-за использования факторизованных предсказаний и увеличение дискретизационной ошибки в результате численных операций. Эти факторы существенно снижают качество семплирования. Данная проблема требует развития эффективных методов, позволяющих обеспечить высокое качество генерируемых данных при меньшем числе шагов семплирования.
#### Метод
Мы предлагаем **learnable sampler distillation (LSD)** — метод оптимизации скорости и качества семплирования в DDMs. LSD основывается на принципе классического метода дистилляции, где "ученик" (student) с меньшим числом шагов семплирования изучает шаг за шагом динамику "учителя" (teacher) с большим числом шагов. Для достижения этой цели мы вводим learnable sampler coefficients — адаптивные коэффициенты, которые динамически оптимизируются для точного алгоритмического синхронизации динамики семплирования ученика и учителя. Более того, мы предлагаем LSD+, который также оптимизирует временную схему (time schedule), распределяя шаги семплирования неравномерно для достижения более эффективного использования ресурсов.
#### Результаты
Мы провели эксперименты на различных задачах: генерации текстов, изображений и синтетических данных. Наши результаты показывают, что LSD и LSD+ значительно повышают качество семплирования DDMs, достигая результатов, которые превосходят существующие методы. Это достигается признаками, такими как более высокая точность, более высокое качество изображений и текстов, а также существенное сокращение числа шагов семплирования, необходимых для достижения исходного качества. Эти результаты доказывают эффективность LSD в решении проблемы неэффективности семплирования в DDMs.
#### Значимость
Предложенные методы LSD и LSD+ имеют широкие применения в области генерируемых данных, включая генерацию текста, генерацию изображений и молекулы. Они позволяют достигать высокого качества с меньшим числом шагов, что экономит ресурсы и ускоряет процессы семплирования. Эти достижения могут иметь большое значение для приложений, требующих быстрого и качественного генерирования данных, таких как генеративные модели текста, генерируемая графика и молекулярная сим
Annotation:
Discrete diffusion models (DDMs) have shown powerful generation ability for
discrete data modalities like text and molecules. However, their practical
application is hindered by inefficient sampling, requiring a large number of
sampling steps. Accelerating DDMs by using larger step sizes typically
introduces significant problems in generation quality, as it amplifies the
impact of both the compounding decoding error due to factorized predictions and
discretization error from numerical approximat...
Показано 271 -
280
из 385 записей