📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 PIRF: Physics-Informed Reward Fine-Tuning for Diffusion Models

2025-09-26

Авторы:

Mingze Yuan, Pengfei Jin, Na Li, Quanzheng Li

Резюме научной статьи "PIRF: Physics-Informed Reward Fine-Tuning for Diffusion Models" ## Контекст В последние годы diffusion models (DM) доказали сильные способности в области генерируемых данных, применяясь в различных сферах, включая научные задачи. Однако, эти модели часто производят выводы, которые нарушают физические законы. Это приводит к проблемам в их применении в таких областях, как физика, химия и биология. Основной проблемой является несоответствие выходных данных модели физическим законам, что приводит к неточностям и несогласованностям в результатах. Эти проблемы требуют новых подходов, которые могли бы обеспечить более точное соблюдение физических законов в процессе генерирования данных. ## Метод Метод PIRF (Physics-Informed Reward Fine-Tuning) предлагает новый подход к решению этой проблемы. Он рассматривает процесс генерирования данных как задачу оптимизации спарсенных наград, где соблюдение физических законов определяется как награда. Этот подход объединяет ранее развитые методы в рамках парадигмы награды. Основная идея заключается в том, чтобы избежать использования значения функции построения, которая часто приводит к неточностям и нестабильности во время обучения. Вместо этого PIRF использует метод динамической оптимизации, где градиенты награды вычисляются на уровне целого траектории, что позволяет эффективнее учитывать физические законы. Были представлены два ключевых подхода: (1) локализованное обратное распространение (layer-wise truncated backpropagation), которое учитывает локальность физических законов, и (2) весовая регуляризация, позволяющая повысить эффективность и данных и генерируемых моделями. ## Результаты Для проверки эффективности PIRF проводились эксперименты на пяти разных PDE-benchmarks. Результаты показали, что PIRF показывает значительное соблюдение физических законов, даже при ограниченном числе итераций. В сравнении с другими подходами, PIRF продемонстрировал лучшую точность и более стабильное поведение в ходе обучения. Были также проведены анализы влияния различных параметров регуляризации и локализации на качество результатов. Эти результаты подтверждают, что PIRF может значительно повысить качество генерируемых данных в сфере научной моделирования. ## Значимость PIRF может быть применен в различных научных областях, где требуется учет физических законов в процессе генерирования данных. Это может быть применено в таких сферах, как физическая моделирования, химическое моделирование, биологическое моделирование и другие. Одним из ключевых преимуществ является улучшение точности и сохранение эффективности обучения. Это может привести к повышени

Annotation:

Diffusion models have demonstrated strong generative capabilities across scientific domains, but often produce outputs that violate physical laws. We propose a new perspective by framing physics-informed generation as a sparse reward optimization problem, where adherence to physical constraints is treated as a reward signal. This formulation unifies prior approaches under a reward-based paradigm and reveals a shared bottleneck: reliance on diffusion posterior sampling (DPS)-style value function ...

ID: 2509.20570v1 cs.LG, cs.AI, cs.CE, cs.SY, eess.SY

arXiv PDF

📄 KANO: Kolmogorov-Arnold Neural Operator

2025-09-24

Авторы:

Jin Lee, Ziming Liu, Xinling Yu, Yixuan Wang, Haewon Jeong, Murphy Yuezhen Niu, Zheng Zhang

## Контекст Колмогоров-Арнольд операторы (KANO) представляют собой современный подход к обработке данных в сложных физических системах. Они работают с двумя доменами: частным и пространственным, используя символическую интерпретацию. Однако, недостатки чисто спектральных подходов, таких как Fourier Neural Operator (FNO), ограничивают их эффективность в обработке динамических процессов. В этом контексте KANO предлагается как расширенная альтернатива с улучшенной гибкостью и точностью в решении задач, связанных с физическими операторами. ## Метод KANO основывается на двух основных компонентах: спектральной и пространственной базах. Он использует спектральные базы для выделения основных частотных составляющих и пространственных баз для точного представления положения в пространстве. Эта уникальная архитектура позволяет KANO обрабатывать данные с различным уровнем сложности. Метод также реализует символическую интерпретацию, чтобы обеспечить понимание и воспроизведение результатов на теоретическом уровне. ## Результаты Эксперименты показали, что KANO превосходит FNO в обработке динамических процессов, где FNO сталкивается с проблемами связанными с сильно зависимостью от положения в пространстве. В задаче реконструкции гамильтонианов (Quantum Hamiltonian Learning), KANO достиг символического представления с точностью до четвёртого знака после запятой в коэффициентах и получил инфидемльность в приблизительно $6 \times 10^{-6}$, что значительно превосходит результаты FNO. ## Значимость Исследования KANO открывают новые возможности в области обработки данных в физике и квантовых системах. Его применимость распространяется на задачи, требующие высокой точности и универсальности в физической моделировании. Особый потенциал KANO опережает существующие методы, что делает его привлекательным для использования в сложных системах. ## Выводы Основные результаты KANO показали, что он эффективен в обработке данных с различными уровнями сложности. Будущие исследования будут направлены на улучшение его скорости и общей гибкости, а также на применение в других областях, где необходима точная символическая модель.

Annotation:

We introduce Kolmogorov--Arnold Neural Operator (KANO), a dual-domain neural operator jointly parameterized by both spectral and spatial bases with intrinsic symbolic interpretability. We theoretically demonstrate that KANO overcomes the pure-spectral bottleneck of Fourier Neural Operator (FNO): KANO remains expressive over generic position-dependent dynamics for any physical input, whereas FNO stays practical only for spectrally sparse operators and strictly imposes a fast-decaying input Fourie...

ID: 2509.16825v1 cs.LG, cs.AI, cs.CE

arXiv PDF

📄 A Graph Machine Learning Approach for Detecting Topological Patterns in Transactional Graphs

2025-09-18

Авторы:

Francesco Zola, Jon Ander Medina, Andrea Venturi, Amaia Gil, Raul Orduna

## Контекст Современные финансовые системы сталкиваются с возрастающей сложностью в избегании финансовой преступности, которая приобретает все более сложные формы. Особенно актуальным стало проблематичное использование цифровых платформ в криминальных схемах, включая цифровые активы и криптовалюты. Традиционные подходы, основанные на правилах, часто оказываются неэффективными, так как не учитывают сложные интеракции между субъектами в транзакционных графах. Чтобы обнаруживать такие схемы, необходимо анализировать графовые структуры и выявлять подозрительные тенденции. В работе предлагается расширенный подход, который использует графовые методы машинного обучения для распознавания топологических особенностей в транзакционных графах, что позволяет улучшить обнаружение сложных финансовых преступлений. ## Метод Разработанный подход включает в себя четыре этапа препроцессинга: (i) извлечение графовых структур, (ii) учет временных аспектов для управления большими множествами узлов, (iii) выявление сообществ в графе, (iv) применение автоматических стратегий метки для получения неполных, но полезных меток. Такой фреймворк позволяет усилить значимость данных для графовых моделей. На этапе моделирования используются графовые автоэнкодеры (Graph Autoencoders, GAE), которые проводят сжатие и восстановление графа, а также изучают топологические модели. Эксперименты проводятся с использованием трех различных вариантов GAE, чтобы оценить их эффективность в задаче распознавания традиционных тенденций в обработке криминальных схем. ## Результаты Проведены эксперименты с использованием транзакционных графов, где применялись различные варианты GAE. Удалось протестировать подход на данных, отражающих сложные криминальные схемы, включая схемы мошенничества. Полученные результаты показали, что GAE адекватно отличают традиционные топологические модели в транзакционных графах, обнаруживая высокоточные модели поведения. Это демонстрирует перспективу использования графовых моделей для преодоления ограничений традиционных систем. ## Значимость Предлагаемый подход имеет широкие перспективы в области финансовой безопасности. Он может быть применен для распознавания финансовых преступлений, оценки рисков, а также для улучшения оперативности и точности в обнаружении подозрительных активностей. Благодаря его преимуществам, подход может стать альтернативой традиционным методам, формируя базу для более глубокого и адаптивного анализа транзакционных данных. Эта работа также открывает возможност

Annotation:

The rise of digital ecosystems has exposed the financial sector to evolving abuse and criminal tactics that share operational knowledge and techniques both within and across different environments (fiat-based, crypto-assets, etc.). Traditional rule-based systems lack the adaptability needed to detect sophisticated or coordinated criminal behaviors (patterns), highlighting the need for strategies that analyze actors' interactions to uncover suspicious activities and extract their modus operandi. ...

ID: 2509.12730v1 cs.LG, cs.AI, cs.CE

arXiv PDF

📄 An Advanced Convolutional Neural Network for Bearing Fault Diagnosis under Limited Data

2025-09-17

Авторы:

Shengke Sun, Shuzhen Han, Ziqian Luan, Xinghao Qin, Jiao Yin, Zhanshan Zhao, Jinli Cao, Hua Wang

## Контекст Проблемы диагностики дефектов в подшипниках широко распространены в машиностроении и технологиях. Эти дефекты могут привести к серьезным последствиям, включая аварии и необходимость в дорогостоящих ремонтах. Большинство текущих систем диагностики используют глубокие нейронные сети, но эти методы требуют больших объемов данных для эффективного обучения. Однако в реальных условиях общего доступа к высококачественным метканным данным часто ограничено из-за высоких затрат или беспрецедентных конфиденциальности. Этот факт ставит под угрозу эффективность существующих систем диагностики. Многие методы глубокого обучения, такие как традиционные согласованные нейронные сети, сталкиваются с проблемами избыточностью и неэффективностью при обработке недостаточного количества данных. Для решения этих проблем необходимо разработать более устойчивые и эффективные алгоритмы для диагностики дефектов в подшипниках, которые могут работать с ограниченными данными. ## Метод Мы предлагаем новую архитектуру свёрточной нейронной сети, названную "DAC-FCF", которая основывается на двух основных компонентах: 1. **Генерирующая сеть GAN**: Мы используем новую версию генерирующей сети GAN, названную **Conditional Consistent Latent Representation and Reconstruction GAN (CCLR-GAN)**. Эта сеть генерирует более разнообразные и качественные данные для обучения, используя условные представления для поддержки контекста данных. 2. **Обучение с помощью механизма контрастного обучения**: Мы вводим новый механизм, использующий **контрастное обучение** для моделирования отношений между доступными данными. Это позволяет сети учиться более эффективно даже при недостаточном количестве данных. 3. **1D Fourier Convolution Neural Network (1D-FCNN)**: Мы также предлагаем использовать 1D Fourier Convolution, которая может достаточно хорошо извлекать глобальные межсигнальные отношения в звуковых сигналах. Это позволяет сети более эффективно ориентироваться на глобальные модели дефектов в данных. ## Результаты Мы провели эксперименты на двух датасетах: **CWRU (Case Western Reserve University)** и нашем собственном тестовом штабе. На CWRU мы достигли улучшения до 32% в сравнении с базовыми методами. На тестовом штабе — до 10%. Помимо этого, мы провели анализ абляции, который показал значительное влияние каждого отдельного компонента на результат. Эти результаты демонстрируют указанную выше систему DAC-FCF как эффективную и надежную альтернативу существующим методам, особенно в условиях нехватки данных. ## Значимость Алгоритм DAC-FCF может быть применён в различных областях, таких как

Annotation:

In the area of bearing fault diagnosis, deep learning (DL) methods have been widely used recently. However, due to the high cost or privacy concerns, high-quality labeled data are scarce in real world scenarios. While few-shot learning has shown promise in addressing data scarcity, existing methods still face significant limitations in this domain. Traditional data augmentation techniques often suffer from mode collapse and generate low-quality samples that fail to capture the diversity of beari...

ID: 2509.11053v1 cs.LG, cs.AI, cs.CE

arXiv PDF

📄 Intelligent Reservoir Decision Support: An Integrated Framework Combining Large Language Models, Advanced Prompt Engineering, and Multimodal Data Fusion for Real-Time Petroleum Operations

2025-09-17

Авторы:

Seyed Kourosh Mahjour, Seyed Saman Mahjour

#### Контекст Петролом и газом в последние десятилетия сталкиваются с глобальными изменениями спроса и возрастающими запасами. Это привело к необходимости развития новых подходов для эффективного управления запасами, чтобы обеспечить повышение производительности, экономическую эффективность и безопасность. Одним из ключевых аспектов является реализация систем, которые могут быстро анализировать и интерпретировать большие многомерные наборы данных, такие как сейсмические съемки, логи буровых скважин и данные о производстве нефти и газа. Существующие методы часто ограничены в скорости обработки, точности и масштабируемости, что требует применения расширенных технологий на основе искусственного интеллекта для решения этих задач. #### Метод Для разработки интеллектуальной системы поддержки решений в сегменте хранения нефти и газа была разработана интегрированная архитектура, включающую глубоко обученные large language models (LLM), такие как GPT-4o, Claude 4 Sonnet и Gemini 2.5 Pro. Использование advanced prompt engineering позволило оптимизировать данные модели для задач в области нефтегазового делопроизводства. Методология включает в себя инновационную multimodal data fusion, объединяющую сейсмические данные, логи буровых скважин и данные о производстве в единый процесс обработки. Для решения задач реального времени включены chain-of-thought reasoning и few-shot learning. Разработанные модели обрабатывают входные данные с помощью AI-powered vision transformers, что позволяет обеспечить высокую точность в решении задач, таких как разработка запасов, прогнозирование производства и оптимизация бурения. #### Результаты В ходе экспериментов, проведенных на 15 различных резервуарах, алгоритм показал высокую точность резервуарной характеристики (94,2%), предсказания производства (87,6%) и оптимизации местонахождения скважин (91,4%). Модели обеспечивают скорость реакции на реальные данные в подземной среде в подземной среде, достигая обработки в подземной среде в подземной среде в подземной среде в подземной среде в подземной среде в подземной среде в подземной среде 96,2% надежности безопасности, не сообщая о высоком риске во время оценки. Экономические анализы показали снижение затрат от 62 до 78% (средний показатель — 72%) в сравнении с традиционными методами, с периодом возмещения затрат в 8 месяцев. Быстрая адаптация к нескольким сценариям действий была достигнута за счет использования few-shot learning (уменьшение времени на 72%), а автоматизированная оптимизация процесса принятия решений повысила качество анализа в реальном времени на 89%. #### Значимость Разработанный подход может быть применен в сегменте нефтегазово

Annotation:

The petroleum industry faces unprecedented challenges in reservoir management, requiring rapid integration of complex multimodal datasets for real-time decision support. This study presents a novel integrated framework combining state-of-the-art large language models (GPT-4o, Claude 4 Sonnet, Gemini 2.5 Pro) with advanced prompt engineering techniques and multimodal data fusion for comprehensive reservoir analysis. The framework implements domain-specific retrieval-augmented generation (RAG) wit...

ID: 2509.11376v1 cs.LG, cs.AI, cs.CE

arXiv PDF

📄 Equivariant Flow Matching for Symmetry-Breaking Bifurcation Problems

2025-09-05

Авторы:

Fleur Hendriks, Ondřej Rokoš, Martin Doškář, Marc G. D. Geers, Vlado Menkovski

## Контекст Симметричное нарушение (symmetry-breaking) в нелинейных динамических системах часто приводит к существованию нескольких координатных точек. Определение этой многообразия является ключевым заданием в различных областях, включая механику, физику и биологию. Однако существующие машинные обучающиеся модели часто сталкиваются с проблемами при представлении этой многообразия, в том числе их усреднением, что приводит к утрате финерстных деталей. Эта проблема вызвана тем, что многие модели не учитывают симметрии систем, что приводит к неточности в результатах. В этой работе мы предлагаем прогностический подход, основанный на методе соответствия потоков (flow matching), для моделирования полного распределения вероятностей в результатах бифуркаций. Наш подход позволяет генерировать несколько валидных решений, сохраняя симметрии системы с помощью эквивариантного моделирования. Этот подход может быть применен для решения сложных системных задач, включая проблемы упругости и динамики нелинейных систем. ## Метод Мы предлагаем новую методологию, основанную на методе соответствия потоков, для моделирования многообразия решений в системах с симметричным нарушением. Наш алгоритм включает в себя несколько ключевых компонент: 1. **Эквивариантное моделирование**: Мы используем групповые симметрии системы для создания эквивариантных преобразований, что позволяет нам учитывать симметрии в моделировании. 2. **Соответствие потоков**: Мы используем потоковые модели для точного соответствия целевых распределений, что позволяет нам получать множество валидных решений. 3. **Симметричное соответствие**: Мы предлагаем стратегию симметричного соответствия, которая позволяет точно выравнивать предсказанные и целевые выходы под действием группы симметрий. Наш подход позволяет не только генерировать множество решений, но также учитывать симметрии системы, что является ключевой чертой нашего подхода. ## Результаты Мы провели эксперименты на различных системах, включая тушечные модели и физические задачи, такие как проблема "бруса гнутого под нагрузкой" (buckling beam problem) и уравнение Аллена-Чана (Allen-Cahn equation). Наши результаты показали, что наш подход выдает значительно более точные и обоснованные результаты по сравнению с другими методами, в том числе непростоты (non-probabilistic) и вариационными методами. Мы также проверили нашу модель на данных с высокой размерностью и показали, что она способна точно генерировать несколько решений, сохраняя симметрии системы. Эти результаты указывают на то, что наш подход является эффективным и стабильным для решения задач с многообразием решений в высо

Annotation:

Bifurcation phenomena in nonlinear dynamical systems often lead to multiple coexisting stable solutions, particularly in the presence of symmetry breaking. Deterministic machine learning models struggle to capture this multiplicity, averaging over solutions and failing to represent lower-symmetry outcomes. In this work, we propose a generative framework based on flow matching to model the full probability distribution over bifurcation outcomes. Our method enables direct sampling of multiple vali...

ID: 2509.03340v1 cs.LG, cs.AI, cs.CE, physics.comp-ph

arXiv PDF

📄 Physics-Inspired Spatial Temporal Graph Neural Networks for Predicting Industrial Chain Resilience

2025-08-27

Авторы:

Bicheng Wang, Junping Wang, Yibo Xue

## Контекст Индустриальная цепь является ключевым элементом в устойчивом развитии национальной экономики. Однако, являясь типичной сложной сетью, индустриальные цепи еще не полностью описаны с точки зрения методологий глубокого обучения. Основная проблема заключается в отсутствии теоретического фреймворка, который бы способствовал пониманию динамики системы и прогнозированию ее устойчивости. В настоящей работе предлагается физико-ориентированный подход к обучению на основе символьных нейронных сетей, который позволяет описывать динамику сложных сетей и предсказывать их устойчивость. ## Метод Предлагаемая модель Physics-Inspired Spatial Temporal Graph Neural Networks (PIST-GNN) объединяет в себе физические законы и методы обучения с применением графовых нейронных сетей. Методология заключается в следующем: 1. **Измерение динамики физических символов**: Модель представляет собой символьные динамические модели, описывающие динамику характеристик физических субъектов в сети. 2. **Спатско-временная коэволюция**: Модель рассматривает коэволюцию нескольких слоев в сети, что позволяет принять во внимание взаимодействия между субъектами. 3. **Физические символы и граф-матрица взаимодействия**: Использования графовых методов для описания динамики взаимодействий субъектов в сети, включая их физические символы. ## Результаты Для оценки модели проводился эксперимент на реальных данных индустриальных цепей. Для обучения и тестирования использовались данные о состоянии субъектов и их взаимодействий. Результаты показали, что PIST-GNN показывает значительно более высокую точность прогноза устойчивости цепи по сравнению с другими подходами. Модель демонстрирует лучший F1-мерный показатель и лучшее значение AUC при предсказании устойчивости. ## Значимость Предложенный подход может быть применен в различных областях, таких как прогнозирование устойчивости экономических систем, планирование производства и анализ рисков в индустрии. Его преимущества заключаются в том, что он учитывает физические свойства субъектов и взаимодействий в сети, что позволяет получить более точные и реалистичные прогнозы. Это может способствовать более эффективному управлению индустриальными цепями и уменьшению рисков. ## Выводы Предложенная модель PIST-GNN демонстрирует высокую точность в прогнозировании устойчивости цепи и демонстрирует значительные преимущества по сравнению с другими подходами. В будущем планируется расширить модель, включив в нее более сложные структуры данных и учитывать больший объем данных. Также

Annotation:

Industrial chain plays an increasingly important role in the sustainable development of national economy. However, as a typical complex network, data-driven deep learning is still in its infancy in describing and analyzing the resilience of complex networks, and its core is the lack of a theoretical framework to describe the system dynamics. In this paper, we propose a physically informative neural symbolic approach to describe the evolutionary dynamics of complex networks for resilient predicti...

ID: 2508.16836v1 cs.LG, cs.AI, cs.CE

arXiv PDF

📄 Compressive Meta-Learning

2025-08-19

Авторы:

Daniel Mas Montserrat, David Bonet, Maria Perera, Xavier Giró-i-Nieto, Alexander G. Ioannidis

#### Контекст В последние годы размеры данных, собираемых в различных областях, стремительно растут. Это привело к появлению новых вызовов в области машинного обучения, таких как необходимость в быстрых и эффективных методах обучения моделей. Классические подходы часто становятся неэффективными при работе с большими количествами данных. Одним из таких подходов является **Compressive Learning**, который предлагает уменьшить размер данных с помощью нелинейных, случайных признаков, создавая компактные, информационно полные представления. Эти представления могут быть легко хранены, передаваемы, обрабатываемы и использованы для дальнейшего обучения моделей. Однако, существующие подходы к компрессивному обучению часто ограничиваются случайными и датасет-независимыми методами, не учитывая структуру данных. В данной работе мы предлагаем **Compressive Meta-Learning**, который мета-обучает оба этапа — кодирования и декодирования — с использованием нейронных сетей, повышая производительность и точность систем. #### Метод **Compressive Meta-Learning** — это новый подход к обучению, который объединяет нейронные сети с фреймворком компрессивного обучения. Мы предлагаем мета-обучение, которое настраивает нейронные сети для эффективного кодирования и декодирования данных. Наша архитектура включает следующие этапы: 1. **Кодирование** — проекция больших наборов данных на компактные представления с помощью нейронных сетей, которые учитывают структуру данных. 2. **Декодирование** — восстановление интересующих параметров из этих представлений без необходимости хранить или обрабатывать оригинальные данные. 3. **Мета-обучение** — оптимизация параметров нейронных сетей таким образом, чтобы они могли эффективно работать с различными данными и задачами. Мы используем продвинутые техники оптимизации и адаптивные функции потерь для обеспечения быстрого и точного обучения. #### Результаты Мы проводили эксперименты с несколькими задачами, включая **Compressive PCA**, **Compressive Ridge Regression**, **Compressive k-means** и **Autoencoders**. Использовались различные данные для оценки точности и эффективности нашего подхода. **Результаты** показывают, что **Compressive Meta-Learning** превосходит существующие методы по скорости и точности обучения. Например, в задаче **Compressive PCA** наши методы обеспечивали быстрее обработку и высокую точность восстановления. Также, мы проводили эксперименты на реальных данных, подтвердив высокую эффективность наших подходов в реальных приложениях. #### Значимость **Compressive Meta-Learning** имеет широкие области применения. Он может быть использован в таких задачах, как **кластеризация**, **регрессия**, **разложение в главные компоненты** и **автокодировани

Annotation:

The rapid expansion in the size of new datasets has created a need for fast and efficient parameter-learning techniques. Compressive learning is a framework that enables efficient processing by using random, non-linear features to project large-scale databases onto compact, information-preserving representations whose dimensionality is independent of the number of samples and can be easily stored, transferred, and processed. These database-level summaries are then used to decode parameters of in...

ID: 2508.11090v1 cs.LG, cs.AI, cs.CE, cs.DB, 68T07, 68T05, 68T09, I.2.6; I.5.1; G.3; H.2.8

arXiv PDF

📄 GSMT: Graph Fusion and Spatiotemporal TaskCorrection for Multi-Bus Trajectory Prediction

2025-08-15

Авторы:

Fan Ding, Hwa Hui Tew, Junn Yong Loo, Susilawati, LiTong Liu, Fang Yu Leong, Xuewen Luo, Kar Keong Chin, Jia Jun Gan

## Контекст Городской транспорт, особенно автобусные линии, является ключевым компонентом урбанизированных транспортных систем. Однако точность прогноза маршрутов автобусов остается вызовом, особенно в районах с ограниченным доступом к многомодальным данным. Оставшийся вариант — использование данных GPS, но они имеют свои ограничения в точности и надежности. Наша мотивация заключается в разработке модели, которая использует доступные данные GPS и дополняет их с помощью расширенных методов машинного обучения для корректного прогнозирования маршрутов. ## Метод Мы предлагаем GSMT (Graph Fusion and Spatiotemporal Task Correction), комбинацию Graph Attention Network (GAT) и Sequence-to-Sequence Recurrent Neural Network (RNN). GAT извлекает специфические локальные зависимости данных, а RNN обрабатывает последовательности данных GPS. Более того, GSMT включает в себя Task Corrector, который выполняет детальный анализ и сортировку исторических данных путей, чтобы выявить различные модели движения и улучшить прогнозы. Этот двухэтапный подход позволяет объединять динамические и статические данные, улучшая точность и универсальность прогнозов маршрутов. ## Результаты Мы проверили GSMT на реальных данных города Куала-Лумпур. Модель была тестирована в условиях сложной тактической среды, где были проведены сравнения с другими популярными моделями. Результаты показали, что GSMT не только превосходит конкуренты в краткосрочном и долгосрочном прогнозировании маршрутов, но и достигает высокой точности в условиях проведения экспериментов, демонстрируя выигрыш в качестве прогнозов на несколько процентов. ## Значимость Наша модель может быть применима в различных ситуациях, где необходимо точно прогнозировать траектории движения, например, для управления транспортом, мониторинга дорожного движения и планирования маршрутов. Основные преимущества GSMT заключаются в ее универсальности, модифицируемости и высокой производительности в сложных транспортных средах. Это может привести к улучшению управления транспортом и к более эффективной планировке городских маршрутов. ## Выводы GSMT доказала свою эффективность в таске прогнозирования маршрутов автобусов в тяжелых городских условиях. Мы планируем расширить модель, внедрив более сложные механизмы обучения и выполнив эксперименты на более широком множестве данных, чтобы продемонстрировать его универсальность и надежность в разных областях.

Annotation:

Accurate trajectory prediction for buses is crucial in intelligent transportation systems, particularly within urban environments. In developing regions where access to multimodal data is limited, relying solely on onboard GPS data remains indispensable despite inherent challenges. To address this problem, we propose GSMT, a hybrid model that integrates a Graph Attention Network (GAT) with a sequence-to-sequence Recurrent Neural Network (RNN), and incorporates a task corrector capable of extract...

ID: 2508.09227v1 cs.LG, cs.AI, cs.CE

arXiv PDF

📄 VAE-DNN: Energy-Efficient Trainable-by-Parts Surrogate Model For Parametric Partial Differential Equations

2025-08-09

Авторы:

Yifei Zong, Alexandre M. Tartakovsky

Решение задач параметрических нелинейных уравнений в частных производных (ПДЕ) требует высокоэффективных и точных методов. В этой работе предлагается модель VAE-DNN, которая является тренируемой по частям суррогатной моделью для решения прямых и обратных задач. Она использует архитектуру вариативного автоэнкодера (VAE), состоящую из энкодера, полносвязной нейронной сети и декодера. Энкодер сжимает высокоразмерный вход $y(\bm{x})$ в латентное пространство $\bm\mu_{\bm\phi_y}$, затем нейросеть отображает его в пространство $\bm\mu_{\bm\phi_h}$ решения ПДЕ $h(\bm{x},t)$, которое восстанавливается декодером. Отдельная тренировка каждого компонента существенно сокращает время и энергию по сравнению с лидирующими моделями FNO и DeepONet. Исследования показывают, что VAE-DNN превосходит их по точности и эффективности в решении уравнений течения грунтовых вод.

Annotation:

We propose a trainable-by-parts surrogate model for solving forward and inverse parameterized nonlinear partial differential equations. Like several other surrogate and operator learning models, the proposed approach employs an encoder to reduce the high-dimensional input $y(\bm{x})$ to a lower-dimensional latent space, $\bm\mu_{\bm\phi_y}$. Then, a fully connected neural network is used to map $\bm\mu_{\bm\phi_y}$ to the latent space, $\bm\mu_{\bm\phi_h}$, of the PDE solution $h(\bm{x},t)$. Fin...

ID: 2508.03839v1 cs.LG, cs.AI, cs.CE, 68

arXiv PDF

Показано 21 - 30 из 30 записей