📚 Саммари научных статей из arXiv

Найдено 239 результатов по запросу 'cs.HC, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Conversational DNA: A New Visual Language for Understanding Dialogue Structure in Human and AI

2025-08-13

Авторы:

Baihan Lin

## Контекст Понимание и анализ диалогов — это ключевой аспект во многих областях, включая психологию, образовательные технологии, искусственный интеллект и даже лингвистику. Однако традиционные методы анализа диалогов часто сводятся к статистическим обзорам, которые не полностью отражают глубину и сложность человеческого общения. Это ставит под вопрос эффективность таких подходов при анализе диалогов, где важны такие аспекты, как эмоциональная напряженность, тематическая структура и интерактивная инерция. "Conversational DNA" — это инновационный подход к визуализации диалогов, который предлагает новую систему знаков для интерпретации и понимания структуры диалога. Он предлагает трактовать диалог как живую систему, где каждая часть может быть визуализирована и проанализирована с помощью биологических метафор, таких как цветные градиенты, темные линии и лепестковые структуры. Такой подход позволяет выявлять взаимодействия и шаблоны, которые могут быть пропущены при традиционном анализе. Таким образом, "Conversational DNA" предлагает новую перспективу для понимания и визуализации диалогов, которая может помочь не только в живых общениях, но и в искусственных системах. ## Метод "Conversational DNA" — это визуальная система, основанная на техниках данных и биологических метафор. Она предлагает визуальные модели, которые иллюстрируют структуру и динамику диалога. Цветные градиенты используются для представления эмоциональных траекторий, когда частичные оттенки цвета могут указывать на рывки или эмоциональные штормовые волны. Темные линии используются для представления темы или темных полосок, которые охватывают разные части диалога. Также используются лепестковые структуры, которые помогают отобразить логические отношения между разными топиками и темами. Методология включает в себя несколько этапов: предварительная обработка данных, визуализация диалога с помощью метафорических моделей и экспериментальный анализ результатов. Для использования этой методики, необходимо превратить диалог в графическое представление, где каждый элемент (слово, фраза, топик) представляется в виде "структурного состава", который можно сравнивать и анализировать. Этот подход позволяет понять, как тематическая структура диалога развивается во времени и как разные элементы связаны друг с другом. ## Результаты В экспериментах были использованы данные из терапевтических бесед, а также диалогов, происходивших между людьми и искусственным интеллектом. Визуальные

Annotation:

What if the patterns hidden within dialogue reveal more about communication than the words themselves? We introduce Conversational DNA, a novel visual language that treats any dialogue -- whether between humans, between human and AI, or among groups -- as a living system with interpretable structure that can be visualized, compared, and understood. Unlike traditional conversation analysis that reduces rich interaction to statistical summaries, our approach reveals the temporal architecture of di...

ID: 2508.07520v1 cs.HC, cs.AI, cs.CL, cs.CY

arXiv PDF

📄 On the Limits of Selective AI Prediction: A Case Study in Clinical Decision Making

2025-08-13

Авторы:

Sarah Jabbour, David Fouhey, Nikola Banovic, Stephanie D. Shepard, Ella Kazerooni, Michael W. Sjoding, Jenna Wiens

#### Контекст Современные высокоэффективные модели искусственного интеллекта (AI) могут существенно повысить качество человеческих решений, особенно в области клинического медицинского мониторинга. Однако даже высокоточные модели могут давать неточные прогнозы при использовании на практике. Это может привести к автоматизационному биазу, когда люди слишком надеются на AI, что может привести к деформациям в процессе принятия решений. Одним из подходов, предложенных для решения этой проблемы, является "селективная прогнозирование", при которой модель может отказаться от прогнозирования, уведомив пользователя, чтобы позволить ему принять решение без помощи AI. Несмотря на потенциальные преимущества, эта идея требует подтверждения на реальных данных. #### Метод Мы провести эксперимент с участием 259 клинических специалистов, которые выполняли задачи диагностики и лечения больных. Мы сравнили их базовые результаты без использования AI с их результатами при использовании AI с и без селективного прогнозирования. Мы измерили их диагностическую точность в каждом случае. Это позволило нам изучить, насколько селективность может изменить поведение клинических специалистов в различных условиях. #### Результаты Наши результаты показывают, что селективность может значительно воздействовать на решения клинических специалистов. Без AI, точность диагноза была 66%, а с AI, но без селективности, она падала до 56%. С селективностью, она восстанавливалась до 64%. Однако наблюдалось изменение характера ошибок: при селективности, клиники пропускали более диагнозов (18% увеличение пропущенных диагнозов) и не получали достаточного лечения (35% увеличение пропущенных лечений) по сравнению с ситуацией без AI. #### Значимость Наши результаты имеют важное значение для проектирования будущих систем человеко-AI. Они показывают, что хотя селективность может снизить ошибки при диагоностике, она может привести к другим типам проблем, таким как упущение лечения. Это подтверждает необходимость в эмпирических исследованиях, чтобы лучше понять, как пользователи взаимодействуют с AI в сложных ситуациях. #### Выводы Мы можем сделать вывод, что селективность может помочь уменьшить влияние неточных прогнозов AI, но она не безупречна и может привести к новым проблемам. Будущие исследования должны сосредоточиться на понимании и оптимизации взаимодействия человека с AI в клинических ситуациях.

Annotation:

AI has the potential to augment human decision making. However, even high-performing models can produce inaccurate predictions when deployed. These inaccuracies, combined with automation bias, where humans overrely on AI predictions, can result in worse decisions. Selective prediction, in which potentially unreliable model predictions are hidden from users, has been proposed as a solution. This approach assumes that when AI abstains and informs the user so, humans make decisions as they would wi...

ID: 2508.07617v1 cs.HC, cs.AI

arXiv PDF

📄 CognitiveArm: Enabling Real-Time EEG-Controlled Prosthetic Arm Using Embodied Machine Learning

2025-08-13

Авторы:

Abdul Basit, Maha Nawaz, Saim Rehman, Muhammad Shafique

## Контекст С появлением нейропротезирования, проблема эффективного контроля протезных конечностей становится все более важной. Управление такими конечностями через нейронные сети требует точного анализа и реализации быстрых классификаторов. Одним из ключевых вопросов является повышение точности классификации во время реального времени, не ухудшаясь по квалити. Нагрузка на ресурсы и задержка при совместном использовании моделей и железа также являются сложными проблемами для достижения эффективного управления. Область исследования включает нейробиомедицинскую инженерию, виртуальную и расширенную реальность, как области, где решения могут найти применение. Одним из ключевых мотивов является развитие технологий, которые позволят повысить самостоятельность и качество жизни людей с ограниченными физическими возможностями. ## Метод Мы представляем CognitiveArm - систему управления протезом, которая использует нейронные сети, обученные с использованием BrainFlow. Эта библиотека позволяет структурировать данные EEG и подавать их на вход дебированным DL-моделям. Мы использовали функции глубинного обучения, включая эволюционный поиск для поиска оптимальных параметров. Чтобы оптимизировать модели для реального времени, мы применяли методы как компрессии, так и квантования. Для обучения сетей мы создали выборку EEG-данных и провели пайплайн аннотации, чтобы получать точные метки для классификаторов. Помимо этого, мы добавили возможность управления голосом, чтобы включать режимы управления, используя речевой ввод. ## Результаты Наши эксперименты показали, что модели, обученные с помощью CognitiveArm, достигли 90% точности в классификации трех основных действий (лево, право, неподвижность). Мы выполнили эксперименты на OpenBCI UltraCortex Mark IV, который стабильно передавал сигналы EEG. Мы доказали, что модели работают на ресурсозатратном оборудовании, но не ухудшают точность. Мы также продемонстрировали, что модели могут реагировать на голосовые команды, что позволяет переключаться между режимами управления (например, рукопожатие или держание чашки). ## Значимость CognitiveArm может применяться в нейропротезировании, виртуальной и расширенной реальности, а также в биомедицинской инженерии. Он обеспечивает более высокую точность и реакцию, чем предыдущие решения, что позволяет повысить самостоятельность пользователя. За счет оптимизации для ресурсозатратного железа, CognitiveArm возможно использовать в настоящее время, что делает его более привлекательным для практического использования. Мы также отметили, что это решение может быть расширено для других сенсорных сигналов, таких как IMU и

Annotation:

Efficient control of prosthetic limbs via non-invasive brain-computer interfaces (BCIs) requires advanced EEG processing, including pre-filtering, feature extraction, and action prediction, performed in real time on edge AI hardware. Achieving this on resource-constrained devices presents challenges in balancing model complexity, computational efficiency, and latency. We present CognitiveArm, an EEG-driven, brain-controlled prosthetic system implemented on embedded AI hardware, achieving real-ti...

ID: 2508.07731v1 cs.HC, cs.AI, 68T50, 68T40, 68T07, 92C55, I.2.7; I.2.9

arXiv PDF

📄 ChatGPT on the Road: Leveraging Large Language Model-Powered In-vehicle Conversational Agents for Safer and More Enjoyable Driving Experience

2025-08-13

Авторы:

Yeana Lee Bond, Mungyeong Choe, Baker Kasim Hasan, Arsh Siddiqui, Myounghoon Jeon

## Контекст В настоящее время технологии в сфере транспорта стремятся к созданию безопасных, удобных и эффективных систем взаимодействия для водителей. Одной из проблем в этой области является ограниченность набора функций и контекстной гибкости существующих систем голосового взаимодействия. Традиционные варианты реализации включают предварительно составленные скрипты или тестовые модели, которые не позволяют обеспечить натуральное и интерактивное взаимодействие водителя с системой. Таким образом, существует необходимость в разработке более гибких и интеллектуальных систем, которые могут обеспечивать более естественное взаимодействие водителя с автомобилем, улучшая как безопасность, так и удовольствие от процесса вождения. ## Метод Для изучения возможностей использования методов глубокого обучения в сфере транспорта была разработана модель взаимодействия, основанная на ChatGPT, которая позволяет водителям вести непрерывные, многократные диалоги с системой. В эксперименте приняли участие 40 водителей, протестировавших систему на базе движения в симуляторе. Участники проверяли три условия: без агента, с предварительно составленным скриптом и с ChatGPT-диалогом. Методы оценки включали сравнение показателей безопасности, удобства и эффективности взаимодействия, а также сбор данных для тематического анализа взаимодействия. ## Результаты Эксперименты показали, что ChatGPT-агент обеспечивает более стабильное вождение по нескольким метрикам. Водители, использовавшие ChatGPT-систему, показали меньшую внутритемпературную вариабельность в отношении дорожного поведения, в том числе уменьшение вариации ускорения, поворотов и отклонений вдоль полосы. Также, ChatGPT-система получила вышеоценки в плане компетентности, анаиматичности, эмоционального доверия и пользовательской приоритетности по сравнению с предварительно составленным скриптом. Тематический анализ говорит о том, что взаимодействия водителей и агентов касались разных тематик, включая помощь в вождении, запросы развлечений и антропоморфные обращения. ## Значимость Исследование показывает, что LLM-powered in-vehicle conversational agents могут стать мощным инструментом для улучшения безопасности и эффективности вождения, обеспечивая более естественное и интерактивное взаимодействие. Эти системы могут применяться в различных сферах, включая сервисы самостоятельного вождения, улучшение интерфейсов транспортных систем и создание более удобных средств для пользователей. Возможно, в будущем модели будут иметь более широкие возможности для взаимодействия с пользователями, включая рас

Annotation:

Studies on in-vehicle conversational agents have traditionally relied on pre-scripted prompts or limited voice commands, constraining natural driver-agent interaction. To resolve this issue, the present study explored the potential of a ChatGPT-based in-vehicle agent capable of carrying continuous, multi-turn dialogues. Forty drivers participated in our experiment using a motion-based driving simulator, comparing three conditions (No agent, Pre-scripted agent, and ChatGPT-based agent) as a withi...

ID: 2508.08101v1 cs.HC, cs.AI, cs.SE

arXiv PDF

📄 Can AI Explanations Make You Change Your Mind?

2025-08-13

Авторы:

Laura Spillner, Rachel Ringe, Robert Porzel, Rainer Malaka

#### Контекст В сфере AI-based decision support systems (DSS), объяснения играют ключевую роль в помощи пользователям определять, когда доверять рекомендациям системы и когда их следует скептически относиться. Это позволяет обеспечить человеческий контроль, способный предотвратить ошибки и биазы в решениях AI. Однако этот подход основывается на предположении, что пользователи будут тщательно рассматривать объяснения, чтобы выявить возможные неточности. Однако наше исследование показало, что многие участники проведенного нами онлайн-опроса тратили мало времени на изучение объяснений и не всегда их тщательно проанализировали. Мы приводим эксплорейтивный анализ этого данных, стремящийся выяснить, какие факторы влияют на то, насколько тщательно пользователи рассматривают объяснения AI, и как это влияет на их готовность изменить мнение на основе рекомендаций AI. #### Метод Мы провели онлайн-исследование, в котором участники выполняли задачи с использованием AI-поддерживаемых DSS. Объяснения были представлены в различных формах, включая текстовые, визуальные и сочетания этих форм. Участники просили рассказать о своем уровне доверия к рекомендациям AI и о том, насколько они готовы изменить свое мнение на основе этих объяснений. Мы также измеряли время, затраченное на изучение объяснений, а также проводили тесты для определения визуальной и когнитивной нагрузки. Данные были проанализированы с помощью статистических методов, чтобы выявить зависимости между различными факторами и откликом пользователей. #### Результаты Наши результаты показали, что некоторые факторы, такие как тип объяснения и нагрузка на визуальную систему, оказывают значительное влияние на количество времени, затраченное пользователями на изучение объяснений. Мы также обнаружили, что те, кто тратил больше времени на изучение объяснений, более готовы менять свое мнение на основе рекомендаций AI. Тем не менее, некоторые участники продолжали придерживаться своих предварительных мнений, даже при доступе к подробным объяснениям. Это отражается в том, что определенные типы объяснений оказывают более сильное влияние на некоторых участников, чем на других. #### Значимость Наши результаты имеют значительное значение для разработки эффективных AI-поддерживаемых DSS. Они отражают необходимость в создании более привлекательных и интересных объяснений, чтобы повысить внимание пользователей. Эти преимущества могут быть применены в различных сферах, включая здравоохранение, финансы и управление, где важно сохранять человеческий контроль над решениями AI. Более широкое применение таких подходов может привести к улучшению качества решений и уменьшению

Annotation:

In the context of AI-based decision support systems, explanations can help users to judge when to trust the AI's suggestion, and when to question it. In this way, human oversight can prevent AI errors and biased decision-making. However, this rests on the assumption that users will consider explanations in enough detail to be able to catch such errors. We conducted an online study on trust in explainable DSS, and were surprised to find that in many cases, participants spent little time on the ex...

ID: 2508.08158v1 cs.HC, cs.AI

arXiv PDF

📄 FDC-Net: Rethinking the association between EEG artifact removal and multi-dimensional affective computing

2025-08-12

Авторы:

Wenjia Dong, Xueyuan Xu, Tianze Yu, Junming Zhang, Li Zhuo

## Контекст Электроэнцефалограмма (EEG)-базированная распознавание эмоций играет ключевую роль в области аффектного расчленения и брайн-компьютерных интерфейсов. Однако практические применения сталкиваются с рядом сложностей, включая влияние различных физиологических артифактов на EEG-записи. Необходимость удаления этих артифактов часто отделяется от задачи распознавания эмоций, что приводит к ошибкам усреднения и неэффективному использованию взаимосвязов между этими задачами. Кроме того, существующие модели не учитывают ретроспективную характеристику артифактов, что затрудняет систематический подход к улучшению нотрости к шумам. Предлагаемый подход нацелен на создание комплексного решения, объединяющего удаление артифактов и распознавание эмоций в едином контексте. ## Метод Предлагаемая модель, **FDC-Net (Feedback-Driven Collaborative Network for Denoising-Classification Nexus)**, представляет собой динамическую систему, где обе задачи — удаление артифактов и распознавание эмоций — связаны динамически. Основные инновации включают: 1. **Bidirectional Gradient Propagation**: Обеспечивает взаимодействие между задачами с помощью обратного распространения градиентов, чтобы обеспечить системное улучшение обеих задач. 2. **Gated Attention Mechanism**: Интегрирует Transformer с frequency-adaptive design и learnable band-position encoding для детального анализа частотных компонент EEG. 3. **Joint Optimization Strategy**: Объединяет удаление артифактов и распознавание эмоций в единую систему, уменьшая ошибки усреднения и увеличивая точность. ## Результаты Данные для тестирования включили два популярных EEG-данныхсета: DEAP и DREAMER, каждый из которых содержит многомерные метки эмоций. - **Denoising Performance**: FDC-Net показал максимальную корреляционную константу (CC) 96.30% на DEAP и 90.31% на DREAMER, превосходя существующие методы. - **Emotion Recognition Accuracy**: На DEAP достиг 82.3+7.1%, а на DREAMER — 88.1+0.8%, продемонстрировав высокую устойчивость к артифактам. Эти результаты показывают, что FDC-Net не только эффективно удаляет артифакты, но и повышает точность распознавания эмоций в условиях влияния артифактов. ## Значимость Предложенный подход может быть применен в различных областях, включая клиническую практику, разработку брайн-компьютерных интерфейсов и анализ эмоциональных состояний в реальном времени. Главные преимущества: - Увеличение точности распознавания эмоций в ситуациях, характеризующихся визуальными и оккулюсурных артифактами. - Достижение новых показателей в систематической уменьшении влияния артифактов на задачу распознавания эмоций. - Легко встраивается в существующие моде

Annotation:

Electroencephalogram (EEG)-based emotion recognition holds significant value in affective computing and brain-computer interfaces. However, in practical applications, EEG recordings are susceptible to the effects of various physiological artifacts. Current approaches typically treat denoising and emotion recognition as independent tasks using cascaded architectures, which not only leads to error accumulation, but also fails to exploit potential synergies between these tasks. Moreover, convention...

ID: 2508.05231v2 cs.HC, cs.AI

arXiv PDF

📄 Do Ethical AI Principles Matter to Users? A Large-Scale Analysis of User Sentiment and Satisfaction

2025-08-12

Авторы:

Stefan Pasch, Min Chul Cha

## Контекст В последние годы искусственный интеллект (AI) внедряется все более активно в рабочие процессы организаций и повседневные приложения. Это привело к расширению политических и промышленных норм, определяющих принципы этики AI, такие как справедливость, прозрачность и надежность. Несмотря на это, показатели того, насколько эти принципы воспринимаются и ценятся пользователями, остаются неполными. Этот факт мотивирует исследование связи между этичными AI-принципами и удовлетворением пользователей, чтобы понять, как эти принципы влияют на их оценку продуктов AI. ## Метод Для изучения этой проблемы были анализированы более 100 000 отзывов о AI-продуктах с платформы G2. Использовались трансформер-базные языковые модели для измерения тональности отзывов по семи этичным изданиям, определенным Управлением Европейского Союза по Ответственному AI. Эти издания включают: 1) безуклонность, 2) прозрачность, 3) надежность, 4) справедливость, 5) научность, 6) гуманность и 7) социальное благополучие. Этот подход позволил выявить системные отношения между этичными AI-принципами и удовлетворением пользователей. ## Результаты Анализ отзывов показал, что все семь этичных изданий положительно связаны с удовлетворением пользователей. Однако разницы в этой связи существуют в зависимости от роли пользователя и типа продукта. Технические пользователи и оценщики платформ разработки AI чаще обсуждают системные аспекты, такие как прозрачность и управление данными. В то же время нетехнические пользователи и оценщики приложений для конечных пользователей сосредоточены больше на гуманных аспектах, таких как управление человеческим волей и общественное благополучие. Особенно значительным является сильнейшее влияние этики AI на удовлетворение нетехнических пользователей и приложениях для конечных пользователей по всем семь метрикам. ## Значимость Эти находки говорят о важности этикой AI при разработке продуктов. Они подчеркивают необходимость учета контекстных отличий в зависимости от роли пользователя и типа продукта. Эти результаты могут помочь компаниям разрабатывать AI-продукты, которые будут удовлетворять разные потребности пользователей, учитывая их различные представления о значимости этики. ## Выводы Основным достижением этого исследования является доказательство положительного влияния этики AI на удовлетворение пользователей. Будущие исследования должны углубиться в изучение контекстных различий, чтобы создавать более индивидуализированные AI-решения, учитывающие различные потребности пользователей и роли. Это может привести к бо

Annotation:

As AI systems become increasingly embedded in organizational workflows and consumer applications, ethical principles such as fairness, transparency, and robustness have been widely endorsed in policy and industry guidelines. However, there is still scarce empirical evidence on whether these principles are recognized, valued, or impactful from the perspective of users. This study investigates the link between ethical AI and user satisfaction by analyzing over 100,000 user reviews of AI products f...

ID: 2508.05913v1 cs.HC, cs.AI, cs.CL

arXiv PDF

📄 REFS: Robust EEG feature selection with missing multi-dimensional annotation for emotion recognition

2025-08-12

Авторы:

Xueyuan Xu, Wenjia Dong, Fulin Wei, Li Zhuo

#### Контекст Affective brain-computer interface (BCI) является ключевой технологией для взаимодействия на основе эмоций и человеческого распознавания эмоций в области интерактивных систем. Одним из основных заданий в этой области является распознавание многомерных эмоций, которое позволяет понять более глубокие аспекты человеческих эмоций. Одним из основных источников данных для таких задач являются электроэнцефалограммы (EEG), которые предоставляют многомерные физиологические сигналы. Однако, несмотря на их полезность, EEG-сигналы имеют высокую размерность, что может привести к проблемам, таким как переобучение классификаторов и неэффективность в реальном времени. Еще одна трудность заключается в отсутствии части многомерных меток эмоций в реальных условиях, что может быть вызвано открытым характером сбора данных и отклонениями в индивидуальном восприятии эмоций. Этот факт требует разработки методов, устойчивых к отсутствующим данным и способных обеспечить высокую точность распознавания эмоций. #### Метод Для решения указанных проблем предлагается метод, основанный на адаптивной ортогональной неотрицательной факторной декомпозиции (AONMF). Эта методика использует второордиентные и вышеордиентные корреляции для реконструкции пропущенных многомерных меток эмоций, уменьшая влияние пропусков и выбросов на качество распознавания. Более того, метод включает в себя метод регрессии наименьших квадратов (LSR), который использует граф-основуую многообразие-обучение для регуляризации отбора признаков. Это позволяет уменьшить глобальную редьюндантность признаков и улучшить выбор признаков, даже в условиях пропусков. Сложность решения заключается в том, что необходимо обеспечить высокую точность распознавания в условиях отсутствия многомерных меток, что требует особой уточненной регуляризации и многоуровневой аналитики. #### Результаты Метод был проверен на трех известных многомерных эмоциональных датасетах: DREAMER, DEAP и HDED. В рамках экспериментов были сравнены 13 методов отбора признаков, включая традиционные и современные. Результаты показали, что предлагаемый метод демонстрирует значительное улучшение показателей устойчивости и эффективности в сравнении с конкурентными методами. Он показал лучшую точность распознавания эмоций, даже при отсутствии части меток, что указывает на высокую устойчивость и точность в реальных условиях. #### Значимость Предложенный метод может быть применен в различных областях, таких как распознавание эмоций, отрасли безопасности (для определения эмоционального состояния), медицина (для диагности

Annotation:

The affective brain-computer interface is a crucial technology for affective interaction and emotional intelligence, emerging as a significant area of research in the human-computer interaction. Compared to single-type features, multi-type EEG features provide a multi-level representation for analyzing multi-dimensional emotions. However, the high dimensionality of multi-type EEG features, combined with the relatively small number of high-quality EEG samples, poses challenges such as classifier ...

ID: 2508.05933v1 cs.HC, cs.AI

arXiv PDF

📄 ASLSL: Adaptive shared latent structure learning with incomplete multi-modal physiological data for multi-dimensional emotional feature selection

2025-08-12

Авторы:

Xueyuan Xu, Tianze Yu, Wenjia Dong, Fulin Wei, Li Zhuo

## Контекст Улучшение эмоционального распознавания с использованием мультимодальных физиологических сигналов является актуальной проблемой в области компьютерных интерфейсов мозга. Тем не менее, эти сигналы часто являются высокомерночисленными и могут содержать нерелевантные, повторяющиеся и шумные представления. Такая неочищенная информация легко приводит к переобучению, повышению комплексности обработки и снижению качества распознавания эмоций. Особенно остро эта проблема проявляется при отсутствии данных в некоторых режимах измерений, что часто встречается в реальных условиях. Для решения этих задач развито многочисленное фильтрование признаков. Однако большинство существующих подходов предполагают полноту данных, что не соответствует реальной ситуации. Для улучшения эмоционального распознавания в условиях отсутствия данных необходимо разработать эффективные методы обучения и выделения признаков. ## Метод Метод **Adaptive Shared Latent Structure Learning (ASLSL)** предлагает инновационный подход к обработке неполных мультимодальных физиологических сигналов. Он основывается на предположении, что признаки, имеющие близкие эмоциональные метки, делятся общим скрытым пространством. Метод ASLSL использует адаптивную структуру обучения для извлечения этого общего пространства, что позволяет уменьшить влияние отсутствия данных и выделить наиболее значимые эмоциональные признаки. Данный подход эффективно компенсирует отсутствие или повреждение данных в отдельных модальностях, обеспечивая более точное и высококачественное распознавание эмоций. ## Результаты Авторы провестили эксперименты на двух популярных датасетах (DEAP и DREAMER), которые включают мультимодальные физиологические данные и многомерные метки эмоций. На них сравнивались результаты метода ASLSL с 17 других методов выделения признаков. Экспериментальные результаты показали, что ASLSL демонстрирует превосходство в точности классификации и эффективности в обработке неполных данных. Особенно заметны выигрыши при отсутствии данных в некоторых модальностях, где прочие методы часто снижают качество распознавания. ## Значимость Предложенный подход может быть применен в различных областях, включая компьютерные интерфейсы мозга, медицинскую диагностику и учет важных эмоциональных состояний в ИИ-системах. Он обеспечивает улучшенную точность распознавания эмоций, уменьшает шум и нерелевантную информацию, и значительно сокращает вычислительную сложность. Это делает метод ASLSL незаменимым для приложений, требующих высокого качества распознавания в неполных данных. ## Выводы Метод ASLSL демонстрирует высокую эф

Annotation:

Recently, multi-modal physiological signals based emotion recognition has garnered increasing attention in the field of brain-computer interfaces. Nevertheness, the associated multi-modal physiological features are often high-dimensional and inevitably include irrelevant, redundant, and noisy representation, which can easily lead to overfitting, poor performance, and high computational complexity in emotion classifiers. Feature selection has been widely applied to address these challenges. Howev...

ID: 2508.05934v1 cs.HC, cs.AI, cs.LG

arXiv PDF

📄 Hand by Hand: LLM Driving EMS Assistant for Operational Skill Learning

2025-08-12

Авторы:

Wei Xiang, Ziyue Lei, Haoyuan Che, Fangyuan Ye, Xueting Wu, Lingyun Sun

## Контекст Современные технологии обучения включают в себя возможность получать оперативную помощь от текстово-ориентированных бо LLM (Large Language Models), которые предлагают пользователям текстовые фидбеки и советы. Однако, в сфере обучения оперативным умениям, основанным на физических действиях и требующих тренировки в ходе практических занятий, недостаточно текстовых подсказок для достижения максимальной эффективности. Это связано с тем, что текстовые модели LLM не учитывают важную роль кинестетического ощущения, которая играет ключевую роль в процессе обучения физических навыков. Эта проблема приводит к несоответствию между текстовыми способами обучения и оптимальному восприятию пользователями техник оперативных навыков. Наша мотивация заключалась в развитии новых подходов к обучению оперативных навыков, используя возможности LLM, но с учетом кинестетических аспектов и реальности пользователя. ## Метод Мы предложили новую методологию "Align-Analyze-Adjust", которая позволяет LLM-системе контролировать механический тренажер с использованием Electrical Muscle Stimulation (EMS), чтобы обеспечить гибкую и точную корректировку пользовательских движений во время обучения. Мы разработали FlightAxis, что является инструментом для оперативного обучения навыкам, интегрирующим LLM с EMS-тренажером. Модель FlightAxis работает над собственным пониманием навыков, совместно с LLM, и обеспечивает пользователю кинестетическую поддержку во время процесса обучения. Мы выбрали реактивный подход в разработке, чтобы помочь пользователям регулировать свои движения в реальном времени на основе фидбека ЛЛМ. ## Результаты Мы провели эксперименты с пользователями, которые выполняли задачи симулятора полета, при помощи FlightAxis. Эксперименты показали, что пользователи очень быстро приспособились к LLM-системе, которая следила за их движениями и корректировала их с помощью EMS. Мы измерили уменьшение времени выполнения задач и улучшение точности движений в работе с LLM. Более того, пользователи отметили, что получение кинестетической поддержки из текстовидного LLM-системы улучшила их понимание ошибок и увеличила их вовлечение в процесс обучения. ## Значимость Этот подход имеет большое значение для области обучения оперативных навыков, таких как эвакуация, безопасность в сложных условиях или спасательные маневры. Он может быть применен в обучении различных профессиональных навыков, где требуется ценность кинестетических действий. Мы видим возможность расширения этого подхода на другие сферы, такие как хирургия, техническое обслуживание или спортивное обучение. Основное преимущество FlightAxis заключается в том, что он обесп

Annotation:

Operational skill learning, inherently physical and reliant on hands-on practice and kinesthetic feedback, has yet to be effectively replicated in large language model (LLM)-supported training. Current LLM training assistants primarily generate customized textual feedback, neglecting the crucial kinesthetic modality. This gap derives from the textual and uncertain nature of LLMs, compounded by concerns on user acceptance of LLM driven body control. To bridge this gap and realize the potential of...

ID: 2508.06000v1 cs.HC, cs.AI

arXiv PDF

1
2
20
21
22
23
24

Показано 211 - 220 из 239 записей