📚 Саммари научных статей из arXiv

Найдено 14827 результатов по запросу 'cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 35039 Добавлено сегодня: 432

Последнее обновление: сегодня

📄 Generative AI for Strategic Plan Development

2025-08-13

Авторы:

Jesse Ponnock

## Контекст Генерируемое искусственное интеллектуальное обеспечение (Generative Artificial Intelligence, GAI) получило огромное распространение в сфере технических и профессиональных услуг, где Аппаратное Интеллектуальное Обеспечение (AI) ранее считалось невозможным для автоматизации. Это новаторский подход обеспечивает значительные повышения эффективности и уменьшение расходов в многомерной сфере, в том числе в разработке стратегических планов для крупных организаций. Однако существуют вызовы в технической реализации и эффективном использовании GAI в таких контекстах. Большая часть работы, основывающихся на генерируемом искусственном интеллекте, остается недокументированной или закрытой, что ограничивает комплексное понимание способности GAI в разработке стратегических планов. Данная статья проводит оценку текущих возможностей и модели, а также определяет возможности использования таких моделей в процессе разработки стратегических планов. ## Метод Для разработки стратегических планов в крупных организациях, таких как правительственные органы, предлагается модульная модель, позволяющая использовать GAI. Одна из модулей, концентрирующаяся на тематическом моделировании (topic modeling) для генерирования тем, представляющих "видения" в рамках стратегического плана, была выбрана для подробного анализа. Для этого были применены методы BERTopic и Non-negative Matrix Factorization (NMF) к большому объему отчетов, предоставленных Government Accountability Office (GAO). Использование этих методов позволило генерировать темы, которые позже были сравнены с "видениями", изложенными в стратегических планах. Экспериментальная часть включала обучение моделей, оценку полученных результатов и сравнение их с исходными данными. ## Результаты Было определено, что оба исследованные методы — BERTopic и NMF — способны генерировать темы, представляющие собой подходящие "видения" в рамках стратегического плана. Однако BERTopic показал более высокую эффективность, с корреляцией более чем половины тем с "видениями", определенными в стратегических планах. Это означает, что BERTopic может лучше адаптироваться для генерирования тем, отражающих стратегические цели и подходы. Эти результаты подтверждают, что генерируемое искусственное интеллектуальное обеспечение может быть эффективно использовано в процессе разработки стратегических планов. ## Значимость Результаты этого исследования имеют практическое значение для многомильных-долларовой отрасли стратегического планирования и поддержки правительственных органов. Этот подход может существенно снизить затраты, уменьшить время, необходимое для разработки планов, и обеспечить

Annotation:

Given recent breakthroughs in Generative Artificial Intelligence (GAI) and Large Language Models (LLMs), more and more professional services are being augmented through Artificial Intelligence (AI), which once seemed impossible to automate. This paper presents a modular model for leveraging GAI in developing strategic plans for large scale government organizations and evaluates leading machine learning techniques in their application towards one of the identified modules. Specifically, the perfo...

ID: 2508.07405v1 cs.AI, cs.CL, cs.LG, I.2.7; I.5.4

arXiv PDF

📄 AgriVLN: Vision-and-Language Navigation for Agricultural Robots

2025-08-13

Авторы:

Xiaobei Zhao, Xingqi Lyu, Xiang Li

## Контекст Агротехнологии становятся все более важной частью современной сельскохозяйственной отрасли, поскольку требуется повысить эффективность и уменьшить усилия в ручной работе. Одна из ключевых задач — обеспечить мобильность и адаптабильность агрогеоробов. Vision-and-Language Navigation (VLN) является обещающим подходом, позволяющим роботам следовать естественному языку для перемещения к цели. Тем не менее, существующие VLN-методики не ориентированы на специфику агросценариев, что ограничивает их применение. Мы сформулировали проблему и мотивировали развитие методов, которые могут адаптироваться к сельскохозяйственным задачам. ## Метод Мы предложили б BENCHMARK A2A (Agriculture to Agriculture), содержащий 1,560 эпизодов, записанных во время съемок в реальных сельскохозяйственных условиях. Эти съемки выполнены с помощью камеры, размещенной на квадрупедном роботе. Мы также предложили AgriVLN — базовую модель, основанную на Vision-Language Model (VLM), которая подсказывается специальными шаблонами для точного понимания инструкций и среды. Модель может сопоставлять инструкции с существующим сенсорным входом и генерировать низкоуровневые действия для управления роботом. ## Результаты В ходе экспериментов AgriVLN показала значительные достижения на A2A-бенчмарке, особенно при работе с короткими инструкциями. Однако модель столкнулась с проблемами при обработке длинных инструкций, когда не удается отслеживать текущий участок выполнения. Чтобы исправить этот недостаток, мы предложили Subtask List (STL), модуль разбиения на подзадачи, который повысил Success Rate (SR) с 0.33 до 0.47. Сравнение с другими VLN-методами подтвердило, что AgriVLN является ведущей в своем классе в сельскохозяйственной области. ## Значимость Метод AgriVLN может быть использован в сельскохозяйственных процессах, таких как сбор урожая, подкормка растений и мониторинг полей. Он предлагает значительные преимущества, такие как увеличение автономности роботов, повышение точности выполнения задач и снижение времени, потраченного на ручную работу. Это может привести к повышению эффективности сельского хозяйства и сокращению затрат. ## Выводы Мы успешно разработали AgriVLN, первый метод, ориентированный на визуально-языковую навигацию в сельскохозяйственных сценариях. Наши результаты показали существенное улучшение в сравнении с другими методами. Мы планируем продолжить расширять AgriVLN, улучшая его возможности для более сложных инструкций и расширяя его применимость к другим сельскохозяйственным задачам.

Annotation:

Agricultural robots have emerged as powerful members in agricultural tasks, nevertheless, still heavily rely on manual operation or untransportable railway for movement, resulting in limited mobility and poor adaptability. Vision-and-Language Navigation (VLN) enables robots to navigate to the target destinations following natural language instructions, demonstrating strong performance on several domains. However, none of the existing benchmarks or methods is specifically designed for agricultura...

ID: 2508.07406v1 cs.RO, cs.AI, cs.CV

arXiv PDF

📄 A Comprehensive Survey of Self-Evolving AI Agents: A New Paradigm Bridging Foundation Models and Lifelong Agentic Systems

2025-08-13

Авторы:

Jinyuan Fang, Yanwen Peng, Xi Zhang, Yingxu Wang, Xinhao Yi, Guibin Zhang, Yi Xu, Bin Wu, Siwei Liu, Zihao Li, Zhaochun Ren, Nikos Aletras, Xi Wang, Han Zhou, Zaiqiao Meng

## Контекст Недавние успехи в области больших языковых моделей дали новый под Boosting к развитию систем автоматизации решения сложных реальных задач. Однако, многие агентные системы, применяемые в реальных условиях, опираются на ручно сконфигурированные настройки, которые после запуска не изменяются и не адаптируются к постоянно меняющимся обстановке. Для решения этой проблемы в последнее время развиваются подходы к эволюции агентов, нацеленные на автоматическое улучшение систем агентов на основе данных, полученных в процессе взаимодействия и отзывов среды. Этот направление развития становится фундаментом для создания само-эволюционирующих AI-агентов, которые объединяют статические возможности фундаментальных моделей с необходимостью постоянной адаптации в жизненных агентных системах. Настоящая статья посвящена подробному обзору технологий само-эволюционирования агентов, изложенных в рамках концептуального рам frameset. ## Метод Основной методологией работы является разработка концептуального фреймворка, описывающего общую логику само-эволюционирующих AI-систем. Этот фреймворк включает в себя четыре ключевых компонента: System Inputs (входные данные), Agent System (система агента), Environment (среда), и Optimisers (оптимизаторы). Эти компоненты обеспечивают структуру для категоризации и сравнения различных само-эволюционирующих стратегий. Далее, в рамках этого фреймворка проводится систематический обзор технологий само-эволюционирования, которые ориентированы на различные компоненты системы агента. Также включены специализированные адаптационные подходы, разработанные для сфер, таких как биомедицина, программирование и финансы, где оптимизационные цели тесно связаны с ограничениями домена. Наконец, рассматриваются вопросы оценки, безопасности и этических аспектов само-эволюционирующих систем, которые являются критически важными для их эффективности и надежности. ## Результаты В рамках реализации данного подхода проводились множество экспериментов, использующих различные сложные задачи, включая биомедицинские задачи, задачи программирования и финансовые моделирования. Использовались различные данные, такие как данные из реальных агентных систем, а также синтетические данные для моделирования разных сценариев. Основные результаты включают успешную адаптацию систем к динамическим изменениям в среде, повышение точности решений, а также улучшение эффективности в процессе эволюции. Эксперименты показали, что само-эволюционирующие системы могут значительно улучшить модели агентов, обеспечивая их долгосро

Annotation:

Recent advances in large language models have sparked growing interest in AI agents capable of solving complex, real-world tasks. However, most existing agent systems rely on manually crafted configurations that remain static after deployment, limiting their ability to adapt to dynamic and evolving environments. To this end, recent research has explored agent evolution techniques that aim to automatically enhance agent systems based on interaction data and environmental feedback. This emerging d...

ID: 2508.07407v1 cs.AI, cs.CL, cs.MA

arXiv PDF

📄 Leveraging GNN to Enhance MEF Method in Predicting ENSO

2025-08-13

Авторы:

Saghar Ganji, Mohammad Naisipour

## Контекст Предсказание Энсо (El Niño Southern Oscillation, ENSO) — одно из самых сложных заданий в климатической науке, так как этот климатический феномен влияет на значительное число метеорологических и экономических процессов в мире. Особенной сложностью является долгосрочное предсказание ENSO, поскольку это требует точных прогнозов на много месяцев вперед. Это задача значительно усложняется хаотичностью климатических процессов и громоздкостью многомодельных подходов. Одним из таких подходов является Multimodal ENSO Forecast (MEF), который использует двухмодульную архитектуру с 3D Convolutional Neural Network (3D-CNN) и модулем для последовательностей данных. Однако, существуют ряд ограничений в существующем подходе, в том числе неэффективное использование всего параллельно работающего парковочного агрегата и недостаточная учетная вероятность во взаимосвязи между членами парковочного агрегата. Этот факт мог привести к несостоятельности модели в долгосрочном прогнозировании. Это резюме рассматривает модель, которая использует графовые нейронные сети (GNN) для улучшения MEF в долгосрочных прогнозах ENSO. ## Метод Методология, предложенная в этой статье, использует графовую сеть для моделирования взаимосвязи 80 членов парковочного агрегата MEF. Каждый член парковочного агрегата — это выход отдельного модели MEF. В графе, вершины задаются выходами модели, а рёбра определяются мерой сходства, вычисляемой с помощью RMSE и корреляционной меры. Из этого графа будут выделяться кластеры взаимосвязанных и точных прогнозов. Метод оптимизирует выбор членов парковочного агрегата путем удаления шума и повышения взаимосвязи. Этот процесс преобразует множество 80 прогнозов в оптимальный подбор 20 прогнозов, которые используются для получения окончательного прогноза средним суммарным значением. Это новая стратегия позволяет улучшить прогнозную точность, убрав лишние шумы и повысив внутреннюю консистентность выбранных прогнозов. ## Результаты Проведенные эксперименты показали, что новый подход значимо улучшает прогнозную способность MEF, особенно в ситуациях сложного климатического воздействия, таких как долгосрочные прогнозы ENSO. Использование графовой сети для выбора 20 лучших прогнозов позволило улучшить надежность и точность прогноза, в то же время сократив вероятность получения неточных результатов. Однако, хотя новая модель не всегда превосходит оригинальную MEF, она демонстрирует более стабильное и консистентное поведение, особенно при долгосрочных прогнозах. Таким образом, новый подход дает возможность повысить уровень долгосрочного прог

Annotation:

Reliable long-lead forecasting of the El Nino Southern Oscillation (ENSO) remains a long-standing challenge in climate science. The previously developed Multimodal ENSO Forecast (MEF) model uses 80 ensemble predictions by two independent deep learning modules: a 3D Convolutional Neural Network (3D-CNN) and a time-series module. In their approach, outputs of the two modules are combined using a weighting strategy wherein one is prioritized over the other as a function of global performance. Separ...

ID: 2508.07410v1 physics.ao-ph, cs.AI, I.2.6

arXiv PDF

📄 Real-Time Analysis of Unstructured Data with Machine Learning on Heterogeneous Architectures

2025-08-13

Авторы:

Fotis I. Giasemis

## Контекст Область работы связана с проблемами обработки и анализа неструктурированных данных в рамках партикл-физики. Эта область требует высокой точности для проверки текущих моделей субатомного мира. Благодаря планамумуградуации детекторов коллайдирующихся лучей в мировых центрах, таких как Ларже Хадрон Коллайдер (LHC), производство данных выросло в разы. Это приводит к увеличению требований к вычислительным ресурсам. Ученые и инженеры должны оптимизировать процессы фильтрации и реального времени, чтобы обрабатывать большие объемы данных с помощью машинного обучения (ML), а также эффективно использовать архитектуры процессоров, включая графические процессоры (GPU) и поляризованные логические массивы (FPGA). ## Метод Методология работы основывается на разработке и оптимизации ML-процессов для ускоренных архитектур. Отдельное внимание уделено графовым нейронным сетям (GNN) и их применению в реактивной отслеживаемости частиц в LHCb. Архитектура включает GPU в качестве основного вычислительного ресурса и FPGA в качестве дополнительного ускорителя. Эта конфигурация используется для реализации конечного цепочки анализа данных, ориентированной на реальное время. Его эффективность измеряется по критериям пропускной способности и энергопотребления. ## Результаты Эксперименты проводились на данных, собираемых в LHC. Модель GNN прошла реактивное отслеживание частиц в реальном времени на GPU, показав высокую точность и скорость. Результаты были сравнены с классическими алгоритмами, используемыми в LHCb. Далее, модель была ускорена на FPGA, показывая точность и энергоэффективность, которые близки к результатам GPU. Результаты подтверждают, что GNN может эффективно использоваться для реактивного отслеживания в первом уровне триггера LHCb. ## Значимость Результаты демонстрируют перспективу использования ML в партикл-физике, особенно для решения задач в реальном времени. Это может повысить точность и уменьшить энергопотребление, что важно для сложных систем, таких как LHC. Направления для будущих исследований включают улучшение моделей GNN и их интеграцию с новыми архитектурами ускорителей для достижения еще высокой эффективности. ## Выводы Разработанная GNN-процедура показала высокую эффективность в реактивном отслеживании частиц в реальном времени, когда применяется в LHCb. Это достигнуто благодаря оптимизации методологии и эффективному использованию GPU и FPGA. Будущие исследования будут фокусироваться на улучшении моделей и их интеграции с развивающимися технологиями архите

Annotation:

As the particle physics community needs higher and higher precisions in order to test our current model of the subatomic world, larger and larger datasets are necessary. With upgrades scheduled for the detectors of colliding-beam experiments around the world, and specifically at the Large Hadron Collider at CERN, more collisions and more complex interactions are expected. This directly implies an increase in data produced and consequently in the computational resources needed to process them. At...

ID: 2508.07423v1 hep-ex, cs.AI, cs.DC, cs.LG, physics.data-an

arXiv PDF

📄 Lightning Prediction under Uncertainty: DeepLight with Hazy Loss

2025-08-13

Авторы:

Md Sultanul Arifin, Abu Nowshed Sakib, Yeasir Rayhan, Tanzima Hashem

## Контекст Метеорологические бедствия, такие как молния, являются значительной угрозой для человеческого здоровья, безопасности и экономического благополучия. Эти явления часто приводят к потере жизни, инвалидности, пожарам, повреждению инфраструктуры и высоким экономическим потерям. Несмотря на важность улучшения прогнозирования молнии, существующие модели сталкиваются с рядом проблем: они неэффективно используют наблюдательные данные, такие как радарные отражения и свойства облаков, зависят от дорогостоящих и гиперсентитивных лапласовых систем прогнозирования, а также сталкиваются с проблемами предсказания частоты и распределения сверканий. Эти ограничения подчеркивают необходимость развития более точных и универсальных моделей для молнийного прогноза, которые могли бы существенно облегчить подготовку к экстремальным метеорологическим условиям. ## Метод DeepLight — это новая архитектура глубокого обучения, разработанная для более точного и надежного прогноза молнии. Она использует многовидную архитектуру ввода, включающую метеорологические данные, такие как радарные отражения, свойства облаков и исторические молнийные свидетельства. Архитектура глубокого обучения включает многослойные перцептроны и двух branch конволюционные сети, которые эффективно доставляют информацию о распределении пространственных зависимостей. Для обработки неопределенности пространственно-временного характера молнии, DeepLight вводит **Hazy Loss** — функцию потерь, которая наказывает модель за неправильные предсказания, учитывая их близость к настоящим событиям молнии. Это делает DeepLight более устойчивой к шуму и разнообразию в данных. ## Результаты Для оценки DeepLight проведены эксперименты на реальных данных, включающих радарные отражения, свойства облаков и исторические молнийные события. Модель сравнивалась с тремя современными моделями прогнозирования молнии. Результаты показали, что DeepLight превосходит конкурирующие модели по ключевым показателям, таким как Equitable Threat Score (ETS), с ростом от 18% до 30%. Эти результаты примечательны, так как они достигнуты на разных уровнях метеорологических данных и различных условиях молнии, что говорит о генерализуемости модели. ## Значимость Предлагаемая модель может иметь широкое применение в метеорологии, геодезии и жизнеобеспечении. Она позволяет предвидеть молнию с высокой точностью, что дает возможность внедрения профилактических мер для защиты людей и сохранения инфраструктуры. Особенно значительным является применение модели для оптимизации ресурсов и уменьшения экономических потерь в особенно востребованных отраслях, таких ка

Annotation:

Lightning, a common feature of severe meteorological conditions, poses significant risks, from direct human injuries to substantial economic losses. These risks are further exacerbated by climate change. Early and accurate prediction of lightning would enable preventive measures to safeguard people, protect property, and minimize economic losses. In this paper, we present DeepLight, a novel deep learning architecture for predicting lightning occurrences. Existing prediction models face several c...

ID: 2508.07428v1 cs.LG, cs.AI

arXiv PDF

📄 Freeze and Reveal: Exposing Modality Bias in Vision-Language Models

2025-08-13

Авторы:

Vivek Hruday Kavuri, Vysishtya Karanam, Venkata Jahnavi Venkamsetty, Kriti Madumadukala, Lakshmipathi Balaji Darur, Ponnurangam Kumaraguru

#### Контекст Vision-Language Models (VLMs) показали выдающиеся результаты в области мультимодального понимания, но часто унаследовали гендерные базы из своих данных тренировки. Эти базы могут возникать как из модальности изображений, так и из модальности текста. Несбалансированность таких моделей может привести к неточностям и несправедливости в реальном мире. В данной работе мы расследуем источники этих баз, применяя специальные методы дебаисинга и оценивая их эффективность на классических задачах с контролируемыми данными. #### Метод Мы применяем два основных метода дебаисинга: Counterfactual Data Augmentation (CDA) и Task Vector (TV). CDA заключается в добавлении стереотипических и нестереотипических примеров в тренировочный набор, чтобы снизить ошибки модели в распознавании гендера. Task Vector использвает векторные представления задач, чтобы скорректировать вклад каждой модальности в процессе обучения. Для улучшения данных без дополнительного расхода, мы предлагаем DAUDoS - Data Augmentation Using Degree of Stereotypicality. Этот подход определяет степень стереотипичности каждого примера и добавляет новые сценарии, сбалансировав стереотипы. Мы используем новую метрику, Degree of Stereotypicality, для оценки степени стереотипичности примеров в тренировочных данных. #### Результаты Мы провели эксперименты на датасете VisoGender, анализируя степень вклада каждой модальности в гендерные базы. Наша оценка показала, что CDA снижает гендерный гэп на 6%, в то время как DAUDoS — на 3%, но с применением трети меньше данных. Также оба метода улучшили точность распознавания гендера на 3%. Мы также выявили, что CLIP Vision Encoder и PaliGemma2 Text Encoder являются главными источниками гендерных баз, что позволяет нам вести более точные и эффективные дебаисинговые методы. #### Значимость Наша работа демонстрирует важность анализа источников гендерных баз в мультимодальных моделях и предлагает новые методы для их устранения. Мы предлагаем DAUDoS как эффективное средство для снижения баз с минимальным вычислительным вкладом. Модели с более сбалансированным пониманием гендера могут быть применены в различных областях, таких как диагностика, трудовая справедливость и социальные сети, чтобы уменьшить неточности и повысить справедливость. #### Выводы Мы успешно демонстрируем, что гендерные базы в VLMs могут быть снижены с помощью точечных методов дебаисинга, таких как CDA и DAUDoS. Наше исследование представляет собой залог для будущих исследований в области снижения гендерных баз в мультимодальных моделях, с целью создания более справедливых и эффективных систем. Мы также обосновываем необходимость подробного анализа источников

Annotation:

Vision Language Models achieve impressive multi-modal performance but often inherit gender biases from their training data. This bias might be coming from both the vision and text modalities. In this work, we dissect the contributions of vision and text backbones to these biases by applying targeted debiasing using Counterfactual Data Augmentation and Task Vector methods. Inspired by data-efficient approaches in hate-speech classification, we introduce a novel metric, Degree of Stereotypicality ...

ID: 2508.07432v1 cs.CV, cs.AI

arXiv PDF

📄 Optimizing Districting Plans to Maximize Majority-Minority Districts via IPs and Local Search

2025-08-13

Авторы:

Daniel Brous, David Shmoys

## Контекст В рамках краснотертяшных судебных процессов, эффективное применение Voting Rights Act (VRA) часто включает в себя предоставление суду альтернативным districting plans, которые включают больше majority-minority districts, чем предлагаемый план. Такой подход был применен, например, в Allena v. Milligan (2023), где была проверка districting planа для Alabama. Недавний исследовательский работа Cannon et al. предложила новый heuristic algorithm, который назвали short bursts. Он основывается на сложном random walkе по пространству всех возможных plans, продвигаясь в этих прерывистых "бурстах", где начальный plan для каждого bursting — это лучший из предыдущей iterative. Мы предлагаем метод на основе integer programming (IP), который расширяет работу по stochastic hierarchical partitioning. Этот подход был разработан для оптимизации другого понятия fairness в рамках statewide planов. Мы разрабатываем новый column generation algorithm для создания plans через IP, который опережает short bursts на нескольких наборах данных, создавая statewide plans с большим количеством majority-minority districts. Мы также применяем новую iterative local re-optimization algorithm, которая улучшает каждый базовый plan, и algorithm для увеличения compactness districts без затрагивания number of majority-minority districts. ## Метод Мы используем integer programming (IP) для создания districting plans, которые optimize number of majority-minority districts. Наша методология основывается на previous work по stochastic hierarchical partitioning, который генерирует robust set of potential districts в виде columns в типичной задаче set partitioning. Мы развиваем новый column generation algorithm, который находит plans через IP, превосходя short bursts по нескольким наборам данных. Мы также применяем новый local re-optimization algorithm, который iteratively улучшает любой baseline plan. Для увеличения compactness districts без затрагивания number of majority-minority districts, мы разрабатываем дополнительный algorithm. ## Результаты Мы проводим эксперименты с разными наборами данных, сравнивая наши результаты с short bursts. Наши integer programming-based plans показывают значительное улучшение в создании statewide plans с большим количеством majority-minority districts. Мы также используем new local re-optimization algorithm для улучшения каждого baseline planа. Для увеличения compactness districts без затрагивания number of majority-minority districts, мы применяем дополнительный algorithm. Эти результаты показывают, что наш подход эффективнее short bursts на нескольких наборах данных. ## Значимость Наш подход может быть применен в краснотертяшных судебных процессах для оптимизации districting plans, которые будут включать больше majority-minority districts. Это имеет практическую значимость для применения Voting Rights Act и улучшения fair representation. Мы также экспериментируем с применением наших результатов в других областях, таких как дизайн fair systems и optimization в других сферах, где подходы, основанные на integer programming, могут привести к более effective и fair solutions. ## Выводы Мы достигли значительных улучшений в создании districting plans с большим количеством majority-minority districts по сравнению с short bursts. Этот подход демонстрирует эффективность интегрированного итеративного метода, который может использоваться в других областях с целью создания fair и compact solutions. Мы планируем продолжить исследования в этой области, включая расширение framework для у

Annotation:

In redistricting litigation, effective enforcement of the Voting Rights Act has often involved providing the court with districting plans that display a larger number of majority-minority districts than the current proposal (as was true, for example, in what followed Allen v. Milligan concerning the congressional districting plan for Alabama in 2023). Recent work by Cannon et al. proposed a heuristic algorithm for generating plans to optimize majority-minority districts, which they called short ...

ID: 2508.07446v1 cs.DS, cs.AI, cs.CY

arXiv PDF

📄 Stackelberg Coupling of Online Representation Learning and Reinforcement Learning

2025-08-13

Авторы:

Fernando Martinez, Tao Li, Yingdong Lu, Juntao Chen

## Контекст Область применения глубокого обучения, особенно в сфере глубокого обучения с подкреплением (deep reinforcement learning, RL), стала одной из самых динамичных и востребованных направлений в ИИ. Одна из сложностей в RL заключается в том, чтобы эффективно выучить функции представления (representation learning), которые позволяют оптимизировать поведение агента в сложных средах. Эта задача становится еще сложнее при недостатке сигналов отклика (sparse reward signal). Несмотря на успехы внедрения сложных дополнительных методов (auxiliary objectives) или полного разделения (decoupling) процессов представления и управления, эти подходы требуют дополнительных ресурсов и усложняют архитектуру. В настоящей работе предлагается новый подход, который структурирует взаимодействие между сетями представления и управления с помощью игровой динамики в стиле Stackelberg. ## Метод Предлагаемая модель, Stackelberg Coupled Representation and Reinforcement Learning (SCORER), основывается на принципах игры Stackelberg, где один из агентов (leader) стратегически выбирает представления, которые повышают эффективность действий второго агента (follower). Формализм заключается в том, что leader-сеть стремится минимизировать ошибку Bellman для follower-сети. Для поиска равновесия в игре используется алгоритм двух уровней (two-timescale algorithm). Это позволяет приближаться к оптимальному равновесию лидера и последователя. Метод может быть запущен на различных стандартных архитектурах, таких как DQN, и не требует дополнительных сложных архитектур или целей. ## Результаты Проведенные эксперименты показывают, что SCORER улучшает обучаемость (sample efficiency) и достигает высокой последней производительности (final performance) на бенчмарк-задачах, в том числе Atari-2600 и других. В сравнении с традиционными подходами, которые используют дополнительные цели или разделение представления и управления, SCORER показывает значительное улучшение с точки зрения эффективности и простоты реализации. Это подтверждает, что новый формализм динамики взаимодействия может быть более эффективен, чем сложные архитектуры или добавление дополнительных целей. ## Значимость Предлагаемый подход может быть применен в различных задачах глубокого обучения с подкреплением, где важно эффективно обучать функции представления и управления. Это может быть полезно в таких сферах, как игровые решения, моделирование систем, исследования робототехники и другие задачи, где требуется высокая эффективность и сложность решений. Одним из основных преимуществ является то, что данный подход уменьшает сложность и при этом повышает производительность. ## Выводы Предложенная модель SCORER демонстрирует, что можно совершенствовать RL-алгоритмы, не прибегая к добавлению сложных дополнительных

Annotation:

Integrated, end-to-end learning of representations and policies remains a cornerstone of deep reinforcement learning (RL). However, to address the challenge of learning effective features from a sparse reward signal, recent trends have shifted towards adding complex auxiliary objectives or fully decoupling the two processes, often at the cost of increased design complexity. This work proposes an alternative to both decoupling and naive end-to-end learning, arguing that performance can be signifi...

ID: 2508.07452v1 cs.LG, cs.AI

arXiv PDF

📄 Noise-Aware Generative Microscopic Traffic Simulation

2025-08-13

Авторы:

Vindula Jayawardana, Catherine Tang, Junyi Ji, Jonah Philion, Xue Bin Peng, Cathy Wu

## Контекст Одним из ключевых задач в интеллектуальных системах транспорта является точное моделирование индивидуального поведения транспортных средств на уровне микроскопической симуляции. Это необходимо для реалистичного генерирования и реакции на сложные транспортные явления, такие как фантомные подвисания трафика. Традиционные модели движения транспортных средств справляются с этой задачей за счет упрощения, отдавая при этом сложность. С другой стороны, появление новых данных, полученных с помощью инфраструктурных камер, предоставило новые возможности для развития агентно-ориентированных моделей. Однако существующие данные часто являются чистыми или нестандартными, что не соответствует реальной сложности данных сенсоров. Наша работа ориентирована на создание новых моделей, признавающих шум и неточности в данных, чтобы сделать модели более реалистичными и применимыми в практике. ## Метод Мы применяем адаптированные стратегии шум-сознательного обучения, применяющиеся в компьютерном зрении, для моделирования трафика на основе данных сенсоров. В частности, мы используем генерирующую модель, адаптированную с помощью шум-сознательных функций потерь. Эти модели генерируют трафик, учитывая характерные ошибки и неточности, такие как разброс данных и ошибки сенсоров. Для этого мы используем I-24 MOTION Scenario Dataset (I24-MSD), который содержит реальные данные сенсоров и позволяет тренировать модели, учитывая эти недостатки. Это позволяет создавать более реалистичные симуляции трафика, учитывая реальные сложности. ## Результаты Модели, использующие шум-сознательные функции потерь, показали лучшую реалистичность в сравнении с традиционными моделями. Мы проводили эксперименты с разными уровнями шума в данных и проверяли качество моделей на разных показателях. Наши результаты показывают, что при увеличении шума модели становятся более реалистичными и устойчивыми. Это указывает на то, что модели, учитывающие шум в данных, более приближены к реальности и могут более точно отражать сложности транспортных систем. ## Значимость Мы видим применение нашей модели в различных областях, таких как планирование трафика, прогнозирование движения транспорта и разработка систем управления. Наш подход позволяет создавать более реалистичные и устойчивые модели, учитывающие реальные характеристики данных сенсоров. Эта технология может способствовать улучшению безопасности и эффективности транспортных систем, а также облегчить разработку новых систем управления трафиком. ## Выводы Мы доказали, что модели, учитывающие шум в данных, могу

Annotation:

Accurately modeling individual vehicle behavior in microscopic traffic simulation remains a key challenge in intelligent transportation systems, as it requires vehicles to realistically generate and respond to complex traffic phenomena such as phantom traffic jams. While traditional human driver simulation models offer computational tractability, they do so by abstracting away the very complexity that defines human driving. On the other hand, recent advances in infrastructure-mounted camera-base...

ID: 2508.07453v1 eess.SY, cs.AI, cs.MA, cs.RO, cs.SY

arXiv PDF

1
2
1402
1403
1404
1405
1406
1482
1483

Показано 14031 - 14040 из 14827 записей