📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Learning to Drive Safely with Hybrid Options

2025-10-30

Авторы:

Bram De Cooman, Johan Suykens

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Out of the many deep reinforcement learning approaches for autonomous driving, only few make use of the options (or skills) framework. That is surprising, as this framework is naturally suited for hierarchical control applications in general, and autonomous driving tasks in specific. Therefore, in this work the options framework is applied and tailored to autonomous driving tasks on highways. More specifically, we define dedicated options for longitudinal and lateral manoeuvres with embedded saf...

ID: 2510.24674v1 cs.LG, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Task-Level Insights from Eigenvalues across Sequence Models

2025-10-14

Авторы:

Rahel Rickenbach, Jelena Trisovic, Alexandre Didier, Jerome Sieber, Melanie N. Zeilinger

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Although softmax attention drives state-of-the-art performance for sequence models, its quadratic complexity limits scalability, motivating linear alternatives such as state space models (SSMs). While these alternatives improve efficiency, their fundamental differences in information processing remain poorly understood. In this work, we leverage the recently proposed dynamical systems framework to represent softmax, norm and linear attention as dynamical systems, enabling a structured comparison...

ID: 2510.09379v1 cs.LG, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Accuracy, Memory Efficiency and Generalization: A Comparative Study on Liquid Neural Networks and Recurrent Neural Networks

2025-10-11

Авторы:

Shilong Zong, Alex Bierly, Almuatazbellah Boker, Hoda Eldardiry

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This review aims to conduct a comparative analysis of liquid neural networks (LNNs) and traditional recurrent neural networks (RNNs) and their variants, such as long short-term memory networks (LSTMs) and gated recurrent units (GRUs). The core dimensions of the analysis include model accuracy, memory efficiency, and generalization ability. By systematically reviewing existing research, this paper explores the basic principles, mathematical models, key characteristics, and inherent challenges of ...

ID: 2510.07578v1 cs.LG, cs.AI, cs.SY, eess.SY, I.2.6; I.2.8

arXiv PDF

📄 Certifiable Safe RLHF: Fixed-Penalty Constraint Optimization for Safer Language Models

2025-10-08

Авторы:

Kartik Pandit, Sourav Ganguly, Arnesh Banerjee, Shaahin Angizi, Arnob Ghosh

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Ensuring safety is a foundational requirement for large language models (LLMs). Achieving an appropriate balance between enhancing the utility of model outputs and mitigating their potential for harm is a complex and persistent challenge. Contemporary approaches frequently formalize this problem within the framework of Constrained Markov Decision Processes (CMDPs) and employ established CMDP optimization techniques. However, these methods exhibit two notable limitations. First, their reliance on...

ID: 2510.03520v1 cs.LG, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Generalization of Graph Neural Network Models for Distribution Grid Fault Detection

2025-10-08

Авторы:

Burak Karabulut, Carlo Manna, Chris Develder

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Fault detection in power distribution grids is critical for ensuring system reliability and preventing costly outages. Moreover, fault detection methodologies should remain robust to evolving grid topologies caused by factors such as reconfigurations, equipment failures, and Distributed Energy Resource (DER) integration. Current data-driven state-of-the-art methods use Recurrent Neural Networks (RNNs) for temporal modeling and Graph Neural Networks (GNNs) for spatial learning, in an RNN+GNN pipe...

ID: 2510.03571v1 cs.LG, cs.AI, cs.SY, eess.SY, I.2.6; I.2.7; C.2.1

arXiv PDF

📄 Unsupervised Detection of Spatiotemporal Anomalies in PMU Data Using Transformer-Based BiGAN

2025-10-02

Авторы:

Muhammad Imran Hossain, Jignesh Solanki, Sarika Khushlani Solanki

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Ensuring power grid resilience requires the timely and unsupervised detection of anomalies in synchrophasor data streams. We introduce T-BiGAN, a novel framework that integrates window-attention Transformers within a bidirectional Generative Adversarial Network (BiGAN) to address this challenge. Its self-attention encoder-decoder architecture captures complex spatio-temporal dependencies across the grid, while a joint discriminator enforces cycle consistency to align the learned latent space wit...

ID: 2509.25612v1 cs.LG, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Physically Plausible Multi-System Trajectory Generation and Symmetry Discovery

2025-10-01

Авторы:

Jiayin Liu, Yulong Yang, Vineet Bansal, Christine Allen-Blanchette

#### Контекст Физически предсказуемые модели являются ключевым инструментом для моделирования динамических систем, включая механизмы, системы движения и системы, изменяющиеся во времени и пространстве. Однако существующие модели обычно ограничены моделированием динамики одной системы с фиксированными физическими параметрами. Такое подход не позволяет обрабатывать системы с неизвестными или множественными системами в разных условиях. Наша мотивация заключается в разработке модели, которая может обучаться и понимать динамику неизвестных множественных систем с разными физическими параметрами и структурами конфигурационных пространств. #### Метод Мы предлагаем Symplectic Phase Space GAN (SPS-GAN), новую архитектуру, которая может обучаться на динамике множества систем с разными физическими параметрами. SPS-GAN генерирует траектории, соответствующие физическим законам, и может применяться для траекторий, видео и других задач. Основная идея заключается в использовании Hamiltonian Neural Network в качестве рекуррентного модуля в составе обучаемой сети генеративного адверсarialного ноутварка (cGAN). Для обнаружения структуры конфигурационного пространства мы используем физический терм, способствующий выделению спарсных представлений. Таким образом, SPS-GAN может обнаруживать конфигурационные пространства для новых систем, не требуя предварительного знания об этих пространствах. #### Результаты Мы провели эксперименты на различных видео-данных для траекторий и синтезированных данных для нескольких систем. Наши результаты показали, что SPS-GAN способен генерировать траектории, которые соответствуют физическим законам, даже когда системы и физические параметры были неизвестны во время учебного процесса. Мы также демонстрируем способность модели выявлять симметрии в данных, что демонстрирует ее применимость в области теории симметрии. Сравнение с другими моделями показало, что SPS-GAN дает похожие результаты, несмотря на то, что она работает с неизвестными и множественными системами. #### Значимость SPS-GAN может быть применена в таких областях, как видео-траектории, синтез видео, анализ симметрии и моделирование динамики систем в различных условиях. Основное преимущество SPS-GAN заключается в ее общности и универсальности. Она может работать без предварительного знания конфигурационных пространств и обрабатывать неизвестные системы. Это создает новые возможности для применения моделей динамики в широких областях, от астрономии до биологии. #### Выводы Мы представляем SPS-GAN, модель, которая преодолевает ограничения существующих моделей траекторий, обу

Annotation:

From metronomes to celestial bodies, mechanics underpins how the world evolves in time and space. With consideration of this, a number of recent neural network models leverage inductive biases from classical mechanics to encourage model interpretability and ensure forecasted states are physical. However, in general, these models are designed to capture the dynamics of a single system with fixed physical parameters, from state-space measurements of a known configuration space. In this paper we in...

ID: 2509.23003v1 cs.LG, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Distributionally Robust Safety Verification of Neural Networks via Worst-Case CVaR

2025-09-24

Авторы:

Masako Kishida

Да, вот максимально подробное резюме научной статьи: ## Контекст Обеспечение безопасности нейронных сетей при входных неопределенностях является ключевой задачей в области применений, требующих высокой надежности, таких как автоматизированная силовая электросеть, мобильные роботы, искусственный интеллект и т. п. Несмотря на то, что методы нейронных сетей позволяют получать высокоточные решения, их безопасность может быть нарушена из-за непредсказуемых входных данных и маловероятных сценариев, в которых модель может показать серьезную неточность. Методы безопасности, основанные на нейронах, должны учитывать такие риски, чтобы обеспечить надежную работу в критичных ситуациях. В этой статье предлагается расширение существующей модели нейронной сети на базе квадратичных ограничений (QC) и семейства методов семейств семейств семейств (SDP), которые учитывают распределение входных неопределенностей и подстраховываются против рисков, связанных с хвостовыми событиями. Это расширение предоставляет более широкий подход к моделированию и валидации нейронных сетей, учитывая характеристики хвостовых событий. ## Метод Метод, предлагаемый в этой статье, расширяет существующий фреймворк квадратичных ограничений (QC) и семейств семейств (SDP) для нейронной сети, добавляя новый подход к интеграции хвостовой рисков в виде квантильного риска (CVaR). Алгоритм использует момент-подобные амбигуитные множества, которые определяют входные неопределенности методом второго размера, чтобы учесть возможные пространственные и тенденциальные характеристики входных данных. Эти амбигуитные множества описываются тремя основными геометрическими формами: эллипсоидами, полигонами и плоскостями. Эти формы используются для моделирования рисков, которые могут возникнуть во время работы нейронной сети. Данный подход гарантирует, что результаты нейронной сети остаются в пределах приемлемой высокой точности, даже при возникновении хвостовых событий. ## Результаты В ходе экспериментов была проверена эффективность нового подхода на нескольких примерах нейронных сетей, в том числе для задач классификации и реализации подхода к защите нейронных сетей в ситуациях, характеризующихся риском хвостовых событий. Были использованы данные, описывающие различные типы нейронных сетей с различными входными неопределенностями. Результаты показали, что интеграция квантильного риска CVaR позволяет улучшить точность моделирования рисков, относящихся к хвостовым событиям, при этом сохраняется высокая скорость вычислени

Annotation:

Ensuring the safety of neural networks under input uncertainty is a fundamental challenge in safety-critical applications. This paper builds on and expands Fazlyab's quadratic-constraint (QC) and semidefinite-programming (SDP) framework for neural network verification to a distributionally robust and tail-risk-aware setting by integrating worst-case Conditional Value-at-Risk (WC-CVaR) over a moment-based ambiguity set with fixed mean and covariance. The resulting conditions remain SDP-checkable ...

ID: 2509.17413v1 cs.LG, cs.AI, cs.SY, eess.SY, math.OC

arXiv PDF

📄 Diffusion-Based Scenario Tree Generation for Multivariate Time Series Prediction and Multistage Stochastic Optimization

2025-09-20

Авторы:

Stelios Zarifis, Ioannis Kordonis, Petros Maragos

## Контекст В оптимизации деcision-making в системах с неопределенностью, таких как энергетические рынки и финансовые рынки, ключевой роль играет статистическое прогнозирование. Наиболее важной задачей является построение сценариев будущих событий, которые могут стать условиями решения. Одним из главных ограничений является то, что прогнозы должны соблюдать принцип непредвиденности (non-anticipativity), что означает, что любое решение должно быть зависимым только от ранее наблюдавшегося данных. На сегодняшний день существуют методы, которые могут генерировать сценарии для похожих задач, однако они часто имеют ограниченную гибкость или сложность в реализации. Мы предлагаем Diffusion Scenario Tree (DST), многомерную модель для генерации сценариев, которая объединяет гибкость и точность в построении прогнозов при соблюдении непредвиденности. ## Метод DST использует идею diffusion-based probabilistic forecasting для построения сценариев. Основоположником является идея, что каждый сценарий представляется как последовательность событий, которые происходят в пространстве достаточно далекого будущего. Эти сценарии рекурсивно собираются в дерево с помощью метода clustering, позволяя выделять схожие траектории и создавать уникальные сценарии. Каждый узел дерева представляет собой наблюдаемое событие, которое может случиться в будущем, чтобы избежать противоречий с принципом непредвиденности. Мы также используем многомерные данные, чтобы учитывать сложности во взаимодействии нескольких переменных, что позволяет генерировать более точные сценарии. ## Результаты Мы проводили эксперименты на задаче энергетического арбитража в энергетических рынках Нью-Йорка. Мы сравнили DST с другими подходами, включая классические модели, такие как ARIMA, и модели Model-Free Reinforcement Learning. Результаты показали, что DST постоянно показывает более высокую точность прогноза и более эффективное управление неопределенностью. Мы также показали, что DST улучшает результаты задач стохастической оптимизации, таких как energy arbitrage, благодаря лучшему учету неопределенности и более точному представлении сценариев. ## Значимость Мы считаем, что наш подход может иметь широкое применение в различных областях, где необходимо учитывать неопределенность, такие как энергетические системы, финансовые рынки, транспортные системы. Наш алгоритм предлагает значительное улучшение по сравнению с существующими моделями, благодаря тому, что он может более точно предсказывать сложные сценарии в многомерных задачах. Мы видим потенциал DST в улучшении деcision-making, особенно в задачах стохастической оптимизации, где точность и эффективность ре

Annotation:

Stochastic forecasting is critical for efficient decision-making in uncertain systems, such as energy markets and finance, where estimating the full distribution of future scenarios is essential. We propose Diffusion Scenario Tree (DST), a general framework for constructing scenario trees for multivariate prediction tasks using diffusion-based probabilistic forecasting models. DST recursively samples future trajectories and organizes them into a tree via clustering, ensuring non-anticipativity (...

ID: 2509.14832v1 cs.LG, cs.AI, cs.SY, eess.SY, I.2.6; I.5.1

arXiv PDF

📄 Convolutional Neural Networks for Accurate Measurement of Train Speed

2025-08-27

Авторы:

Haitao Tian, Argyrios Zolotas, Miguel Arana-Catania

## Контекст В современных железнодорожных системах, точное определение скорости поездов является критическим для обеспечения безопасности и эффективности движения. Существующие методы оценки скорости часто сталкиваются с ограничениями, включая высокую вероятность ошибок в условиях пониженной видимости или при динамичном изменении скорости. Эти недостатки могут привести к негативным последствиям, включая повышение риска аварий. Исследователи стремятся к развитию более точных и надежных методов, которые могут справиться с этими проблемами. Например, Adaptive Kalman Filter (AKF) представляет собой одно из таких решений, но оно также имеет ограничения в обработке сложных данных. Широко распространенной методологией в этой области является использование глубоких нейронных сетей, которые могут анализировать разнообразные признаки и обнаруживать сложные зависимости. Научное сообщество обратило внимание на Convolutional Neural Networks (CNN), которые обладают выдающимися способностями к обработке изображений и сложных изоморфных структур. Это побудило авторов исследовать возможность применения CNN для решения проблемы оценки скорости поездов, с учетом их точности и стабильности. ## Метод Для решения задачи оценки скорости поездов было рассмотрено три различных архитектуры Convolutional Neural Networks: single-branch 2D, single-branch 1D и multiple-branch. Single-branch 2D-архитектура была применена для анализа входных данных, отражающих динамику движения поезда, используя изображения, представляющие собой распределение датчиков по ширине поезда. Single-branch 1D-архитектура, в свою очередь, оперировала потоком данных от индивидуальных датчиков, чтобы извлечь индивидуальные признаки. Multiple-branch-модель объединила оба подхода, обрабатывая данные как на уровне изображений, так и на уровне отдельных признаков. Каждая модель была обучена с использованием высококачественных данных, полученных из симуляторов железнодорожного оперативного движения. Для сравнения, на каждой модели также был применен Adaptive Kalman Filter (AKF). Эксперименты проводились на синтетических данных, включая ситуации с и без активации Wheel Slide Protection (WSP), чтобы оценить устойчивость моделей в разных оперативных условиях. ## Результаты Результаты экспериментов показали, что CNN-модели, особенно multiple-branch-архитектура, достигли высокой точности в оценке скорости поездов. Multiple-branch-модель демонстрировала наилучший результат, превосходя другие архитектуры и AKF в почти всех аспектах. Она была способна точно выделить и извлечь сложные зависимости в данных, даже при пониженной видимости или быстром изменении скорости. Single-branch 2D-архитектура показала хороший результат в обработке дан

Annotation:

In this study, we explore the use of Convolutional Neural Networks for improving train speed estimation accuracy, addressing the complex challenges of modern railway systems. We investigate three CNN architectures - single-branch 2D, single-branch 1D, and multiple-branch models - and compare them with the Adaptive Kalman Filter. We analyse their performance using simulated train operation datasets with and without Wheel Slide Protection activation. Our results reveal that CNN-based approaches, e...

ID: 2508.17096v1 cs.LG, cs.AI, cs.SY, eess.SY

arXiv PDF

Показано 1 - 10 из 13 записей