📊 Статистика дайджестов
Всего дайджестов: 34123 Добавлено сегодня: 101
Последнее обновление: сегодня
Авторы:
Chenkai Mao, Jonathan A. Fan
## Контекст
Ускоренный и точный симуляционный анализ задач, описываемых частичными дифференциальными уравнениями (ПДУ), является ключевым заданием во многих областях, включая физику, инженерию и науки о компьютерах. Нейронные сети (NN) показали надежды как альтернативные модели для решения ПДУ, особенно в ситуациях, когда данные трудно поддаются статическим моделям. Однако поддержка высокой точности и масштабируемости для различных условий границ и разрешений остается сложной задачей. Наша мотивация заключается в развитии моделей, которые могут обеспечить высокую точность, гибкость и масштабируемость для решения многофизических задач, включая задачи связанные с Maxwell's equations, которые широко применяются в нанофотонике и радиотехнике.
## Метод
Мы предлагаем модель субдомена с нейронными операторами, которая использует нейронные сети для представления субдоменов в рамках мультиуровневого метода скелета (multilevel skeleton method). Модель может учитывать произвольные Робин-типы граничных условий в качестве входных данных. Мы используем этот подход в качестве предусловия для итерационного решения ПДУ. Наша модель также позволяет построить глобальные коареспаты, чтобы повысить эффективность решения больших масштабных задач с помощью многоуровневого доменного декомпозиционного метода. Мы используем задачу двумерных уравнений Максвелла как модельную систему для тренировки сети, но при этом учитываем комплексную вариативность, включающую различные размеры, разрешения, диэлектрические среды и частоты волн.
## Результаты
Мы проводим эксперименты, используя симуляции двумерных Максвелловых уравнений. Модель показывает высокую точность в решении задач различных размеров и разрешений, включая ситуации с разными диэлектрическими средами. Мы используем мультиуровневый доменный декомпозиционный подход, чтобы подтвердить эффективность сети в решении крупномасштабных задач. Мы также демонстрируем применимость модели в проектировании нанофотонических устройств с многочастотными оптическими элементами, показывая способность модели к точному выполнению инверсных задач технического дизайна. Модель показывает большую скорость и точность по сравнению с другими методами решения ПДУ.
## Значимость
Наш подход имеет широкое применение в аппаратуре для теоретической физики, нанотехнологиях, радиотехнике и других сферах, где требуется точное решение ПДУ. Он предлагает значительные преимущества в скорости и точности сравнительно с существующими методами. Модель также может способствовать развитию систем, оптимизированных для выполнения высоко
Annotation:
Neural networks have promise as surrogate partial differential equation (PDE)
solvers, but it remains a challenge to use these concepts to solve problems
with high accuracy and scalability. In this work, we show that neural network
surrogates can combine with iterative algorithms to accurately solve PDE
problems featuring different scales, resolutions, and boundary conditions. We
develop a subdomain neural operator model that supports arbitrary Robin-type
boundary condition inputs, and we show t...
📄 A Multi-Resolution Benchmark Framework for Spatial Reasoning Assessment in Neural Networks
2025-08-20Авторы:
Manuela Imbriani, Gina Belmonte, Mieke Massink, Alessandro Tofani, Vincenzo Ciancia
## Контекст
Современные нейросетевые модели часто изучаются с точки зрения их моделирования различных сложностей, включая распознавание изображений, текстов и даже звуков. Однако менее внимательно рассматриваются их возможности решать задачи связанные с пространственным разумом, т.е. возможностью понимать и работать с пространственными отношениями, такими как масштаб, расстояние и топологические свойства. Эти способности важны во многих прикладных областях, таких как медицинское изображение, геометрическое моделирование и графическое дизайн. Несмотря на прогрессы в области глубокого обучения, текущие нейросетевые модели испытывают значительные проблемы при решении задач, связанных с пространственным разумом. Эта статья представляет собой первый шаг в разработку комплексного фреймворка для оценки пространственных умений нейросетевых моделей, с целью выявления их ограничений и развития стратегий для их улучшения.
## Метод
Фреймворк представляет собой систематизированный подход к оценке пространственных умений нейросетевых моделей. Он включает в себя следующие компоненты: 1) **генерацию синтетических данных**: построены две категории данных — задачи по топологической анализу (мазы для анализа подключенности) и задачи геометрического расчета (задачи вычисления расстояний); 2) **стандартизированное обучение модели**: используется автоматизированный подход, включающий кросс-валидацию и инференс; 3) **оценка результатов**: используются метрики, такие как Dice-коэффициент и IoU (Intersection over Union), для меру точности решений. Метод включает в себя использование модели nnU-Net и возможностей проверки моделей с помощью VoxLogicA. Эта гибкая архитектура позволяет эффективно проводить эксперименты, оценивать производительность нейросетевых моделей в разных резолюциях и идентифицировать проблемы в пространственных задачах.
## Результаты
Исследования проводятся на обоих категориях данных, причем каждая из них оценивается на нескольких резолюциях. Эксперименты показали, что нейросети имеют значительные ограничения в пространственных задачах. Например, в задачах по топологическому анализу, модели часто не могут точно определить подключенность объектов, даже при наличии простых задач. В задачах вычисления расстояний, модели также показывают слабую производительность, особенно в случаях, когда задачи становятся более сложными. Эти результаты определяют основные проблемы в пространственном понимании нейросетевых моделей, в том числе неверное понимание связи между объектами и недостаточная способность работать с масштабами.
## Значимость
Разработанный фреймво
Annotation:
This paper presents preliminary results in the definition of a comprehensive
benchmark framework designed to systematically evaluate spatial reasoning
capabilities in neural networks, with a particular focus on morphological
properties such as connectivity and distance relationships. The framework is
currently being used to study the capabilities of nnU-Net, exploiting the
spatial model checker VoxLogicA to generate two distinct categories of
synthetic datasets: maze connectivity problems for to...
Авторы:
Hongxin Yu, Yibing Wang, Fengyue Jin, Meng Zhang, Anni Chen
## Контекст
Транспортная система является ключевым элементом современного города, и ее эффективная работа важна для обеспечения хорошего качества жизни жителей. Одним из важнейших аспектов транспортной системы является точная оценка состояния трафика. Трафик можно оценивать с помощью различных методов, включая моделирующие, использующие исторические данные, и сочетающие обе эти технологии. Несмотря на прогресс в области искусственного интеллекта и машинного обучения, существуют сложности в точном предсказании состояния трафика, особенно в реальном времени. Эта проблема становится ключевой для городов с большим количеством жителей и транспортных средств. Моделирование трафика, основанное на физических законах, предоставляет базу для точных и надежных предсказаний, однако требует высокого расхода ресурсов. Таким образом, имеется мотивация для разработки новых методов, которые объединяли бы точность моделирования с быстродействием и эффективностью машинного обучения.
## Метод
Для решения проблемы точной оценки трафика была разработана новая архитектура, основанная на deep operator network (DeepONet), которая интегрирует физические законы и машинное обучение. Архитектура дополнена расширенными возможностями: (1) приемом двумерных данных, позволяющим использовать конволюционные нейронные сети (CNN) для вычислений; (2) внедрением нелинейных слоев и механизма внимания (attention) для улучшения обучения на нерегулярных данных; (3) созданием специальных нейронных сетей для адаптивной определения параметров моделей трафика. Эти усовершенствования позволяют PI-DeepONet лучше адаптироваться к различным условиям трафика и повысить точность оценки.
## Результаты
Исследования проводились на двух наборах данных: малый участок наблюдений на Freeway NGSIM и большой городской участок в Китае. Технология PI-DeepONet была сравнена с четырьмя базовыми методами оценки трафика. Результаты показали, что PI-DeepONet обеспечивает более точную оценку показателей трафика, таких как поток и средняя скорость. Ключевым преимуществом новой системы является возможность оценивать трафик в реальном времени с высокой точностью, даже при изменении условий трафика.
## Значимость
Разработанная система имеет широкое применение в транспортной инфраструктуре. Она может быть использована для улучшения управления трафиком, оптимизации маршрутов, повышения безопасности и повышения эффективности транспортных систем. Помимо этого, PI-DeepONet обладает высокой скоростью работы и низким расходом ресурсов, что делает ее привлекательной для исполь
Annotation:
Traffic state estimation (TSE) falls methodologically into three categories:
model-driven, data-driven, and model-data dual-driven. Model-driven TSE relies
on macroscopic traffic flow models originated from hydrodynamics. Data-driven
TSE leverages historical sensing data and employs statistical models or machine
learning methods to infer traffic state. Model-data dual-driven traffic state
estimation attempts to harness the strengths of both aspects to achieve more
accurate TSE. From the perspect...
Показано 11 -
13
из 13 записей