📚 Саммари научных статей из arXiv

Найдено 14469 результатов по запросу 'cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня

📄 StoryEnsemble: Enabling Dynamic Exploration & Iteration in the Design Process with AI and Forward-Backward Propagation

2025-08-09

Авторы:

Sangho Suh, Michael Lai, Kevin Pu, Steven P. Dow, Tovi Grossman

**Резюме** В дизайн-процессе часто трудно обеспечить широкую экспериментальную работу, сбор отзывов и возврат к предыдущим предположениям из-за ограничений по времени и ресурсам. Это мешает придерживаться основных принципов дизайна. Мы провели формативную исследовательскую работу с 15 участниками, включая UX-практиков, студентов и преподавателей, и выявили трудности связанные с этими ограничениями. Разработанная нами система StoryEnsemble решает эти проблемы, интегрировав AI в интерфейс, состоящий из узлов и связей, и используя методы прямого и обратного распространения. Это позволяет дизайнерам быстро и гибко перемещаться по разным стадиям процесса — от формирования персон и формулирования проблемы до идеоидеации и прототипирования. В исследовании с 10 участниками показано, что StoryEnsemble упрощает итеративный дизайн, делая работу более динамичной и эффективной. Это работа демонстрирует возможности AI для поддержки более интерактивных и гибких дизайн-процессов, облегчая экспериментацию и принятие решений.

Annotation:

Design processes involve exploration, iteration, and movement across interconnected stages such as persona creation, problem framing, solution ideation, and prototyping. However, time and resource constraints often hinder designers from exploring broadly, collecting feedback, and revisiting earlier assumptions-making it difficult to uphold core design principles in practice. To better understand these challenges, we conducted a formative study with 15 participants-comprised of UX practitioners, ...

ID: 2508.03182v1 cs.HC, cs.AI

arXiv PDF

📄 Spatiotemporal wall pressure forecast of a rectangular cylinder with physics-aware DeepUFNet

2025-08-09

Авторы:

Junle Liu, Chang Liu, Yanyu Ke, Wenliang Chen, Kihing Shum, K. T. Tse, Gang Hu

Авторы предлагают DeepUFNet — модель глубокого обучения, способную предсказывать пространственно-временные показатели давления на стенке вокруг квадратного профиля в потоке жидкости. Основная проблема заключается в том, что существующие методы глубокого обучения, основанные на полной спектральной информации, не эффективны для прогнозирования динамических процессов. Разработанная модель объединяет сверточную структуру UNet и Фурьеву нейронную сеть, а также включает в обучение физически контролируемый коэффициент управления высокочастотными потерями. Авторы провели эксперименты в винтовой трубе, собрав базу данных для обучения и тестирования модели. Результаты прогнозирования DeepUFNet соответствуют экспериментальным данным по таким критериям, как статистические характеристики, вариации давления во времени, спектры мощности, распределение в пространстве и времени. Использование коэффициента $\beta$ позволяет модели достичь высокой точности в прогнозировании высокочастотных динамических процессов. Также показано, что DeepUFNet обладает хорошей возможностью вывода при отсутствии части спектральной информации.

Annotation:

The wall pressure is of great importance in understanding the forces and structural responses induced by fluid. Recent works have investigated the potential of deep learning techniques in predicting mean pressure coefficients and fluctuating pressure coefficients, but most of existing deep learning frameworks are limited to predicting a single snapshot using full spatial information. To forecast spatiotemporal wall pressure of flow past a rectangular cylinder, this study develops a physics-aware...

ID: 2508.03183v1 physics.flu-dyn, cs.AI, cs.CE

arXiv PDF

📄 GTPO: Trajectory-Based Policy Optimization in Large Language Models

2025-08-09

Авторы:

Marco Simoni, Aleksandar Fontana, Giulio Rossolini, Andrea Saracino

**Резюме** Политические оптимизации широко используются для тренировки и выравнивания языковых моделей, но имеют существенные ограничения. Метод Group-relative Policy Optimization (GRPO) стал одним из самых эффективных подходов, но страдает двумя главными недостатками. Во-первых, токены часто получают противоречивые награды (положительные и отрицательные), что приводит к нестабильным градиентам и снижению их вероятности. Во-вторых, отрицательные награды могут пенализировать уверенные ответы, приводя к разряжению выходного распределения и ухудшению обучения. Мы предлагаем GTPO (Group-relative Trajectory-based Policy Optimization), который решает эти проблемы. Метод идентифицирует "конфликтные" токены, появляющиеся в завершениях с противоположными наградами, и защищает их от отрицательных обновлений, повышая вероятности положительных. Также GTPO исключает завершения с высоким энтропийным неопределенностью. Благодаря этому GTPO обеспечивает более устойчивое и эффективное обучение, не прибегая к регуляризации KL-дивергенции или ссылочной модели, что подтверждено результатами на GSM8K, MATH и AIME 2024.

Annotation:

Policy-based optimizations are widely adopted today for the training and alignment of language models, where one of the most recent and effective approaches is Group-relative Policy Optimization (GRPO). In this paper, we reveals and analyze two major limitations of GRPO: (i) tokens frequently appear in completions with both positive and negative rewards, leading to conflicting gradient updates that can reduce their output probability, even though can be essential for maintaining proper structure...

ID: 2508.03772v1 cs.LG, cs.AI, cs.CL

arXiv PDF

📄 Reliable Evaluation Protocol for Low-Precision Retrieval

2025-08-09

Авторы:

Kisu Yang, Yoonna Jang, Hwanseok Jang, Kenneth Choi, Isabelle Augenstein, Heuiseok Lim

В статье предлагается Reliable Evaluation Protocol for Low-Precision Retrieval, решающий проблему нестабильности оценочных метрик при использовании низкой числовой точности в системах восстановления информации. Уменьшение точности позволяет эффективно использовать ресурсы, но приводит к связыванию элементов с одинаковым скором, что нарушает надежность оценки. Решением является двухэтапный подход: High-Precision Scoring (HPS), который задействует высокую точность только на этапе подсчета релевантности, и Tie-aware Retention Metrics (TRM), определяющий квантильные характеристики релевантности для точного определения результатов. Эксперименты показали, что HPS значительно уменьшает нестабильность, а TRM точно восстанавливает метрики рейтинга. Этот подход обеспечивает устойчивую и достоверную оценку релевантности в системах с низкой точностью.

Annotation:

Lowering the numerical precision of model parameters and computations is widely adopted to improve the efficiency of retrieval systems. However, when computing relevance scores between the query and documents in low-precision, we observe spurious ties due to the reduced granularity. This introduces high variability in the results based on tie resolution, making the evaluation less reliable. To address this, we propose a more robust retrieval evaluation protocol designed to reduce score variation...

ID: 2508.03306v2 cs.IR, cs.AI, cs.CL

arXiv PDF

📄 When Deep Learning Fails: Limitations of Recurrent Models on Stroke-Based Handwriting for Alzheimer's Disease Detection

2025-08-09

Авторы:

Emanuele Nardone, Tiziana D'Alessandro, Francesco Fontanella, Claudio De Stefano

Обнаружение болезни Альцгеймера (AD) часто требует дорогостоящих нейроимажирований или инвазивных процедур, что снижает доступность диагностики. В данном исследовании исследовались возможности глубокого обучения для нейроинвазивной диагностики AD на основе анализа рукописи. Использовался датасет из 34 заданий по рукописи, собранных у здоровых участников и пациентов с AD. Здесь предлагается подход, в котором рекуррентные нейронные сети (LSTM, GRU, RNN) обучаются на предварительно извлеченных признаках рисунков, а не на непрерывных временных сигналах. Это нарушает основное предположение рекуррентных сетей о непрерывном потоке данных. Исследование показало, что рекуррентные архитектуры сталкиваются с повышенной вариабельностью и недостаточной специфичностью. Точность рекуррентных архитектур оказалась значительно ниже, чем у традиционных методов машинного обучения, которые показали лучший баланс между точностью и метриками обобщаемости. Научная статья подчеркивает ограниченность рекуррентных моделей при работе с дискретными признаками рукописи и выделяет направления для будущих исследований.

Annotation:

Alzheimer's disease detection requires expensive neuroimaging or invasive procedures, limiting accessibility. This study explores whether deep learning can enable non-invasive Alzheimer's disease detection through handwriting analysis. Using a dataset of 34 distinct handwriting tasks collected from healthy controls and Alzheimer's disease patients, we evaluate and compare three recurrent neural architectures (LSTM, GRU, RNN) against traditional machine learning models. A crucial distinction of o...

ID: 2508.03773v1 eess.IV, cs.AI, cs.CV

arXiv PDF

📄 Industrial LLM-based Code Optimization under Regulation: A Mixture-of-Agents Approach

2025-08-09

Авторы:

Mari Ashiga, Vardan Voskanyan, Fateme Dinmohammadi, Jingzhi Gong, Paul Brookes, Matthew Truscott, Rafail Giavrimis, Mike Basios, Leslie Kanthan, Wei Jie

## КОНТЕКСТ И ПРОБЛЕМАТИКА В последнее времение Large Language Models (LLMs) стали важной составляющей в области кодовой оптимизации, позволяя автоматизировать процессы программного инжиниринга и повышать эффективность разработки. Однако для организаций в регулируемых отраслях, таких как финансовые и здравоохранение, существуют строгие ограничения на использование коммерческих моделей LLMs. Эти ограничения вызваны требованиями конфиденциальности данных, соответствия нормативным требованиям и регулятивным ограничениями, что создает значительные препятствия для достижения высокого качества кодовой оптимизации при сохранении экономичности. Разработчики столкнулись с проблемой выбора между коммерческими моделями, которые могут быть ограничены в использовании из-за конфиденциальности данных, и открытыми моделями, которые могут быть менее эффективными в некоторых случаях. Эта проблема особенно актуальна в контексте поддержания высокого уровня производительности и качества кода в условиях строгих нормативных требований. Требуется решение, которое позволит эффективно использовать различные модели LLMs, учитывая ограничения регулятивных требований, и обеспечивающее высокую производительность и экономичность. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения этой проблемы предлагается метод Mixture-of-Agents (MoA), который использует несколько специализированных моделей LLMs для кодовой оптимизации. Этот метод позволяет синтезировать код, объединяя результаты работы нескольких моделей, что повышает качество оптимизации и уменьшает время выполнения. Метод MoA включает в себя несколько этапов: предварительная обработка кода, применение различных моделей LLMs для оптимизации, синтез результатов и оценка качества полученного кода. В рамках этого метода используется комбинация открытых моделей LLMs, которые оптимизируют код в соответствии с требованиями регулятивной совместимости. Архитектура MoA позволяет динамически выбирать наиболее подходящие модели для конкретных задач оптимизации, что повышает эффективность процесса. Кроме того, метод сравнивается с другими подходами, такими как Генетический Алгоритм (Genetic Algorithm, GA), который также используется для кодовой оптимизации, и индивидуальными моделями LLMs. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности метода MoA были проведены эксперименты на реальных индустриальных кодовых базах. Было проанализировано 50 фрагментов кода, и было сгенерировано более 8 700 вариантов оптимизированного кода с использованием различных комбинаций моделей LLMs. Результаты показали, что метод MoA достигает значительных экономий затрат, от 14,3% до 22,2%, и ускоряет процесс оптимизации на 28,6% до 32,2% по сравнению с индивидуальными моделями LLMs. Кроме того, было выявлено, что Генетический Алгоритм (GA) демонстрирует преимущества при использовании коммерческих моделей LLMs, однако оба подхода (MoA и GA) превосходят индивидуальные модели в терминах качества оптимизации и времени выполнения. Эксперименты также показали, что использование MoA с открытыми моделями LLMs позволяет достичь высокого качества оптимизации, соблюдая нормативные требования. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод MoA имеет широкое применение в регулируемых отраслях, где необходимо соблюдать строгие нормативные требования в отношении конфиденциальности данных и соответствия законодательству. Этот метод позволяет организациям эффективно использовать открытые модели LLMs для кодовой оптимизации, обеспечивая высокую эффективность и сокращение затрат. Практическая значимость метода заключается в том, что он предоставляет гибкость в выборе моделей LLMs, позволяя организациям адаптировать процесс оптимизации к своим нуждам и ограничениям. Это также позволяет улучшить качество кода и сократить время разработки, что является критически важным для промышленных приложений. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В результате исследования было показано, что метод Mixture-of-Agents представляет собой эффективное решение для кодовой оптимизации в регулируемых отраслях. Он позволяет достичь высокого качества оптимизации, соблюдая требования конфиденциальности и регулятивной совместимости. Будущие исследования могут фокусироваться на дальнейшем улучшении архитектуры MoA, включая интеграцию более разнообразных моделей LLMs и оптимизацию алгоритмов для более сложных задач. Кроме того, предлагается расширить исследования в области автоматизации процессов программного инжиниринга с использованием LLMs, в частности, для решения более широкого круга задач, включая тестирование, отладку и анализ кода. Это позволит создать более комплексные инструменты для разработки программного обеспечения, соответствующие требованиям регулятивной совместимости и эффективно использующие потенциал LLMs.

Annotation:

Recent advancements in Large Language Models (LLMs) for code optimization have enabled industrial platforms to automate software performance engineering at unprecedented scale and speed. Yet, organizations in regulated industries face strict constraints on which LLMs they can use - many cannot utilize commercial models due to data privacy regulations and compliance requirements, creating a significant challenge for achieving high-quality code optimization while maintaining cost-effectiveness. We...

ID: 2508.03329v2 cs.SE, cs.AI

arXiv PDF

📄 Nemori: Self-Organizing Agent Memory Inspired by Cognitive Science

2025-08-09

Авторы:

Jiayan Nan, Wenquan Ma, Wenlong Wu, Yize Chen

## КОНТЕКСТ И ПРОБЛЕМАТИКА Распространение Large Language Models (LLMs) открыло новые возможности для разработки автономных агентов, способных вести динамические, долгосрочные взаимодействия с пользователями. Однако одной из ключевых проблем, ограничивающих эффективность LLMs в таких сценариях, является их неспособность поддерживать постоянную память в длинных контекстах. Традиционные подходы к управлению памятью в LLMs зависят от произвольной гранулярности при определении базовых единиц памяти и используют пассивные, правиловые механизмы для извлечения информации. Эти ограничения не позволяют моделям эффективно адаптироваться к динамическим, долгосрочным рабочим процессам, что снижает их практическую применимость. Для решения этой проблематики необходим метод, который мог бы организовывать информацию в памяти агента на основе семантических принципов, а не произвольных правил. Также важно обеспечить активный процесс обучения, позволяющий модели активно адаптироваться к новым ситуациям и улучшать свои знания на основе ошибок. На основе этих требований была разработка архитектуры Nemori, вдохновленная принципами когнитивной науки. ## ПРЕДЛОЖЕННЫЙ МЕТОД Nemori представляет новую архитектуру памяти, основанную на двух ключевых принципах. Первый — **Two-Step Alignment Principle**, вдохновленный теорией сегментации событий (Event Segmentation Theory). Этот принцип позволяет автоматически организовывать неструктурированный поток диалогов в семантически согласованные эпизоды, решая проблему гранулярности памяти. Эта процедура разбиения на эпизоды основывается на топорном анализе событий, что обеспечивает высокую семантическую консистенцию. Второй принцип — **Predict-Calibrate Principle**, вдохновленный Free-energy Principle. Этот механизм позволяет агенту активно учиться на основе прогнозных ошибок, преобразуя их в возможности для адаптации и эволюции своих знаний. Агент не только фиксирует новую информацию, но и проверяет свои прогнозы на основе контекста, корректируя свои знания в процессе взаимодействия. Архитектура Nemori сочетает эти принципы в единой системе, которая позволяет агенту динамически организовывать и адаптировать свою память в ответ на изменчивые условия. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности Nemori были проведены эксперименты на двух бенчмарках: LoCoMo и LongMemEval. Эти бенчмарки предназначены для оценки способности моделей обрабатывать длинные контексты и долгосрочные взаимодействия. Nemori демонстрирует значительное превосходство над предыдущими государственными решениями, особенно в ситуациях с длинными контекстами. Результаты показывают, что Nemori не только лучше организовывает память, но и демонстрирует улучшенную способность к адаптации и обучению в реальном времени. Это обеспечивает значительное увеличение точности и согласованности в долгосрочных взаимодействиях. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Nemori имеет широкий спектр применений в областях, требующих долгосрочного взаимодействия, таких как поддержка клиентов, образование и здравоохранение. Его способность активно адаптироваться и эволюционировать делает его идеальным инструментом для автономных агентов, которые должны обрабатывать сложные, динамические рабочие процессы. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ Nemori является значительным шагом вперед в области автономных агентов, основанных на LLMs. Его инновационные принципы обеспечивают эффективное управление памятью и адаптацию к динамическим условиям. Будущие исследования могут фокусироваться на дальнейшем улучшении архитектуры и расширении ее применения в реальных сценариях.

Annotation:

Large Language Models (LLMs) demonstrate remarkable capabilities, yet their inability to maintain persistent memory in long contexts limits their effectiveness as autonomous agents in long-term interactions. While existing memory systems have made progress, their reliance on arbitrary granularity for defining the basic memory unit and passive, rule-based mechanisms for knowledge extraction limits their capacity for genuine learning and evolution. To address these foundational limitations, we pre...

ID: 2508.03341v2 cs.AI

arXiv PDF

📄 U-PINet: End-to-End Hierarchical Physics-Informed Learning With Sparse Graph Coupling for 3D EM Scattering Modeling

2025-08-09

Авторы:

Rui Zhu, Yuexing Peng, Peng Wang, George C. Alexandropoulos, Wenbo Wang, Wei Xiang

## КОНТЕКСТ И ПРОБЛЕМАТИКА Моделирование электромагнитного (ЕМ) рассеяния играет ключевую роль в радиолокационных системах и удаленном зондировании. Тем не менее, высокая сложность этого процесса представляет значительные вычислительные проблемы. Традиционные численные методы, такие как методы конечных элементов или разностных схем, обеспечивают высокую точность, но страдают от недостаточной масштабируемости и высоких затрат на вычисления, особенно при работе с трехмерными (3D) объектами. В поисках более эффективных решений, исследователи в последнее время обратились к подходам, основанным на глубоком обучении. Однако чистые дата-дривенные модели лишены физических ограничений, что может привести к неточным результатам, не говоря уже о необходимости больших объемов меченых данных для обучения. Это ограничивает их применимость в реальных сценариях, где получение меток может быть затруднительным или невозможным. Чтобы решить эти проблемы, необходимо разработать метод, который сочетает высокую точность традиционных численных решений с эффективностью глубоких нейронных сетей, при этом сохраняя физическую согласованность. Такой подход должен быть способен работать с разреженными данными, обеспечивая точность и снижая вычислительные затраты. ## ПРЕДЛОЖЕННЫЙ МЕТОД В данной работе авторы предлагают **U-PINet** (U-shaped Physics-Informed Network) – первую полностью основанную на глубоком обучении и физически обоснованную иерархическую сеть для моделирования ЕМ рассеяния. Основная идея заключается в использовании иерархического разложения стратегии, аналогичной той, которая применяется в численных методах, для моделирования взаимодействий между близкими (near-field) и дальними (far-field) областями. U-PINet использует мультискейл процессинговую нейронную сеть, которая позволяет обрабатывать информацию на разных уровнях детализации. Для моделирования взаимодействий между элементами сетки (mesh elements), авторы используют разреженное графическое представление, которое эффективно учитывает как внутренние (self-coupling), так и внешние (mutual-coupling) взаимодействия. Кроме того, сеть интегрирует физические принципы непосредственно в процесс обучения, что гарантирует физическую согласованность модели. Это позволяет U-PINet обеспечивать высокую точность предсказаний, особенно при работе с сложными 3D объектами, где традиционные методы могут быть неэффективны. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Авторы провели ряд экспериментов для оценки производительности U-PINet. В частности, они использовали данные, полученные из различных 3D моделей, для прогнозирования распределения поверхностных токов. Результаты показали, что U-PINet достигает высокой точности, близко соответствующей результатам традиционных численных решений, при этом значительно сокращая время вычислений. Кроме того, U-PINet была сравнена со стандартными дата-дривенными моделями, и результаты показали, что она превосходит их как по точности, так и по робастности. Например, при прогнозировании размеров радиолокационного сечения (radar cross section, RCS), U-PINet демонстрирует значительно лучшую производительность, что делает ее пригодной для реальных приложений в области радиолокации. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод имеет широкое практическое применение в областях, требующих моделирования ЕМ рассеяния, таких как радиолокация, удаленное зондирование и системы связи. Благодаря своей эффективности и точности, U-PINet может быть использована для ускорения расчетов в этих областях, что позволяет экономить время и ресурсы. Кроме того, физическая согласованность модели гарантирует, что результаты могут быть использованы в приложениях, требующих высокой достоверности, что делает U-PINet пригодной для индустриальных приложений. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В работе была представлена U-PINet – инновационная нейронная сеть для моделирования ЕМ рассеяния, которая сочетает высокую точность традиционных методов с эффективностью глубоких нейронных сетей. Эта модель демонстрирует значительные преимущества в вычислительной эффективности и точности, что делает ее пригодной для решения сложных задач в области радиолокации и удаленного зондирования. В будущем, авторы планируют расширить данный подход на более широкие классы задач, включая динамическое моделирование и многочастичные системы, что может открыть новые возможности для применения этой технологии в различных научных и инженерных областях.

Annotation:

Electromagnetic (EM) scattering modeling is critical for radar remote sensing, however, its inherent complexity introduces significant computational challenges. Traditional numerical solvers offer high accuracy, but suffer from scalability issues and substantial computational costs. Pure data-driven deep learning approaches, while efficient, lack physical constraints embedding during training and require extensive labeled data, limiting their applicability and generalization. To overcome these l...

ID: 2508.03774v1 cs.LG, cs.AI

arXiv PDF

📄 Wearable Music2Emotion : Assessing Emotions Induced by AI-Generated Music through Portable EEG-fNIRS Fusion

2025-08-09

Авторы:

Sha Zhao, Song Yi, Yangxuan Zhou, Jiadong Pan, Jiquan Wang, Jie Xia, Shijian Li, Shurong Dong, Gang Pan

## КОНТЕКСТ И ПРОБЛЕМАТИКА Изучение эмоций и их связи с музыкой представляет собой важный аспект в области affective computing и нейротехнологий. Музыка известна как мощный стимул для индукции эмоций, и её применение в комбинации с техниками Brain-computer Interface (BCI) открывает новые возможности для оценки и регуляции эмоционального состояния. Однако существующие исследования сталкиваются с тремя ключевыми проблемами. Во-первых, **ограничения в выборе стимулов**: традиционные музыкальные корпусы ограничены по размеру из-за проблем с авторскими правами и высокими затратами на кураторство. Это приводит к субъективности выбора музыки, основанной на грубой корреляции между эмоциями и музыкальными характеристиками, которая не учитывает индивидуальные эмоциональные профили. Во-вторых, **ограниченность модальности данных**: многие исследования основываются на унимодальных данных, таких как электроэнцефалография (EEG), что ограничивает понимание эмоциональных процессов, так как игнорируются дополнительные данные из других модальностей, таких как функциональная оптическая томография (fNIRS). В-третьих, **ограниченность портативности**: традиционные системы, такие как штатные гелевые EEG-капы с большим числом каналов, тяжелые и неудобные для повседневного использования, что создает значительные препятствия для реального применения. Для решения этих проблем, исследование предлагает MEEtBrain – инновационный портативный мультимодальный фреймворк, который комбинирует музыку, сгенерированную с помощью искусственного интеллекта (AI), с одновременной записью EEG и fNIRS с помощью лёгкого беспроводного головного устройства, оснащенного сухой электродой. ## ПРЕДЛОЖЕННЫЙ МЕТОД MEEtBrain представляет собой комплексное решение для анализа эмоций (валентность/возбудимость) с помощью мультимодальных нейрофизиологических сигналов. Основными компонентами фреймворка являются: 1. **AI-генерированные музыкальные стимулы**: Искусственный интеллект генерирует музыку в реальном времени, обеспеченную разнообразием и устраняющую субъективность выбора стимулов. 2. **Портативное устройство**: Головное устройство в виде лёгкого беспроводного бандана, оснащенного сухой электродой, позволяет одновременно записывать EEG и fNIRS. Это обеспечивает высокую портативность и комфорт для пользователя. 3. **Мультимодальный анализ**: Данные EEG и fNIRS синхронизированы, что позволяет получать более глубокие и точные инсайты в эмоциональные реакции на музыку. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для проверки эффективности фреймворка было проведено исследование с 20 участниками, в ходе которого была собрана 14-часовая база данных. Участники слушали музыку, сгенерированную AI, при этом регистрировались их эмоциональные реакции через EEG и fNIRS. Результаты показали, что AI-генерированная музыка эффективно индуцирует целевые эмоции (валентность/возбудимость). В настоящее время исследование продолжается, и база данных расширена до 44 участников. Данные будут доступны в открытом доступе для дальнейшего исследования и применения. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ MEEtBrain имеет широкое применение в областях психотерапии, управления стрессом, и взаимодействия человека с искусственным интеллектом. Портативность и мультимодальность делают его применимым в реальных условиях, в том числе в домашних условиях и вне клинических помещений. Открытый доступ к данным позволяет разработчикам и исследователям продолжать работу над улучшением алгоритмов и приложений. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ MEEtBrain успешно решает проблемы субъективности выбора музыки, ограниченности модальности данных и непортативности существующих систем. Будущие исследования могут фокусироваться на улучшении точности анализа эмоций, расширении базы данных и интеграции дополнительных модальностей, таких как движения и голосовые сигналы. Такой подход может привести к созданию более эффективных систем для мониторинга и регуляции эмоционального состояния в реальном времени.

Annotation:

Emotions critically influence mental health, driving interest in music-based affective computing via neurophysiological signals with Brain-computer Interface techniques. While prior studies leverage music's accessibility for emotion induction, three key limitations persist: \textbf{(1) Stimulus Constraints}: Music stimuli are confined to small corpora due to copyright and curation costs, with selection biases from heuristic emotion-music mappings that ignore individual affective profiles. \textb...

ID: 2508.04723v1 cs.SD, cs.AI, eess.AS

arXiv PDF

📄 Data Dependency Inference for Industrial Code Generation Based on UML Sequence Diagrams

2025-08-09

Авторы:

Wenxin Mao, Zhitao Wang, Long Wang, Sirong Chen, Cuiyun Gao, Luyang Cao, Ziming Liu, Qiming Zhang, Jun Zhou, Zhi Jin

## КОНТЕКСТ И ПРОБЛЕМАТИКА Разработка программного обеспечения в сфере сервисно-ориентированных архитектур зачастую сталкивается с высокой сложностью и неоднозначностью требований. Особенно это актуально для систем, требующих сложных поведенческих моделей, условной логики и архитектурных ограничений. Традиционные методы генерации кода, основанные на естественном языке (NL), часто не справляются с этими вызовами из-за неявности и неполноты естественных описаний. Недостаточно точного представления структурных и функциональных зависимостей в описании может приводить к ошибкам в полученном коде, что становится критическим в промышленных приложениях. Одним из ключевых проблем является неточная интерпретация неявных данных зависимостей между компонентами системы. Такие зависимости трудно выразить на естественном языке, особенно в контексте сервис-ориентированных архитектур, где данные передаются между различными сервисами в условиях сложной логики взаимодействия. Это приводит к необходимости создания более точных и формализованных способов моделирования и генерации кода, которые могут учитывать все аспекты системного поведения и данных. В связи с этим, исследователи сформулировали задачу инференса данных зависимостей (Data Dependency Inference, DDI), которая направлена на создание формальных моделей зависимостей и последующего использования этих моделей для генерации кода. Однако, решение этой задачи требует новых подходов, которые могут обеспечить более высокую точность и упростить процесс генерации. ## ПРЕДЛОЖЕННЫЙ МЕТОД Для решения проблемы неявных данных зависимостей, авторы предлагают рамейновый подход под названием UML2Dep, который использует расширенную версию языка моделирования UML (Unified Modeling Language) для сервис-ориентированных архитектур. Этот подход основывается на использовании расширенных UML-диаграмм последовательности (sequence diagrams), которые включают в себя дополнительные элементы, такие как таблицы решений (decision tables) и спецификации API. Эти дополнения позволяют формализовать структурные отношения и бизнес-логику взаимодействия сервисов, что помогает избежать неоднозначности, связанной с естественным языком. Ключевым моментом метода является введение задачи DDI (Data Dependency Inference), которая формализована как задача математического резонанса с помощью специальных стратегий промптов (prompting strategies). Эти стратегии позволяют использовать сильные стороны языковых моделей (LLMs) в математическом резонании для точного определения зависимостей между данными. Дополнительно, метод использует статическую парсинг и прунинг (pruning) зависимостей для уменьшения количества данных, которые необходимо обрабатывать, что повышает точность и эффективность резонанса. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности предложенного метода были проведены эксперименты на реальных данных, включая сложные случаи сервис-ориентированных архитектур. Результаты показали, что использование расширенных UML-диаграмм и метода DDI значительно повышает точность генерации кода. Представление данных в виде графа зависимостей помогло снизить сложность контекста и улучшить качество результирующего кода. Было продемонтрировано, что формализованные подходы к инференсу данных зависимостей позволяют лучше учесть сложность системных взаимодействий и уменьшить количество ошибок в генерируемом коде. Эксперименты также показали, что метод UML2Dep эффективен в уменьшении количества ложных зависимостей и повышении скорости генерации кода. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный метод UML2Dep имеет широкий спектр применений в промышленной разработке программного обеспечения. Он может быть использован для автоматизации генерации кода в сложных системах, где необходимо учитывать множество факторов, таких как данные зависимости, бизнес-логика и архитектурные ограничения. Данный подход повышает эффективность разработки, сокращая время на разработку и уменьшая вероятность ошибок. Кроме того, метод может быть применен в областях, требующих высокой точности и надежности, таких как финансовые системы, ИИ и автономные системы. Он также может быть полезен для разработчиков, которым необходимо быстро создавать код на основе сложных требований. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В рамках исследования было показано, что UML2Dep представляет собой эффективный метод для генерации кода на основе UML-диаграмм последовательности. Данный подход позволяет формализовать сложные требования и улучшить точность генерации кода. Будущие исследования могут фокусироваться на дальнейшем улучшении метода, включая интеграцию с другими технологиями и расширение его применения на другие области разработки.

Annotation:

Large language models (LLMs) excel at generating code from natural language (NL) descriptions. However, the plain textual descriptions are inherently ambiguous and often fail to capture complex requirements like intricate system behaviors, conditional logic, and architectural constraints; implicit data dependencies in service-oriented architectures are difficult to infer and handle correctly. To bridge this gap, we propose a novel step-by-step code generation framework named UML2Dep by leveragin...

ID: 2508.03379v2 cs.AI, cs.SE

arXiv PDF

1
2
1408
1409
1410
1411
1412
1446
1447

Показано 14091 - 14100 из 14469 записей