📚 Саммари научных статей из arXiv

Найдено 239 результатов по запросу 'cs.HC, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Privy: Envisioning and Mitigating Privacy Risks for Consumer-facing AI Product Concepts

2025-10-01

Авторы:

Hao-Ping Lee, Yu-Ju Yang, Matthew Bilik, Isadora Krsek, Thomas Serban von Davier, Kyzyl Monteiro, Jason Lin, Shivani Agarwal, Jodi Forlizzi, Sauvik Das

## Контекст Генерируемые с помощью искусственного интеллекта продукты и сервисы часто порождают новые риски для конфиденциальности пользователей. Однако многие практики не имеют удобных инструментов для опознавания и устранения этих рисков. «Privy» — это инструмент, предназначенный для помощи разработчикам в проведении оценок воздействия на конфиденциальность (Privacy Impact Assessments, PIA) для новых концепций AI-продуктов. Он помогает сформировать понимание рисков и предложить соответствующие меры по их устранению. Privy был разработан на основе исследования, в котором участвовали 11 практиков, и существует в двух версиях: одна — с использованием технологий генерирующих естественный язык (LLM), а другая — на базе шаблонов. ## Метод Privy основывается на методологии оценки воздействия на конфиденциальность, которая включает в себя структурированный подход к выявлению и анализу рисков. Инструмент имеет две версии: одна использует модели генерирующего естественного языка для автоматической генерации вопросов и заметок, в том числе с использованием базы данных существующих исследований; другая версия предлагает шаблоны и простые инструкции для пользователей. Оба варианта прошли тестирование на группе 24 практиков, которые провели PIA для различных AI-концепций. Эксперты по конфиденциальности оценили качество выполненных PIA. ## Результаты Оба варианта Privy позволили практикам проводить PIA, которые были оценены как высококачественные экспертами. Версия с технологией генерирующего естественного языка дала более структурированные результаты, в том числе поиск уникальных рисков и предложение соответствующих мер по их устранению. Практики, использовавшие Privy, отметили, что инструмент помогает улучшить свои навыки и повысить осознание проблем конфиденциальности, что облегчает их работу. Особенно улучшение было замечено в группе, использовавшую LLM-powered версию. ## Значимость Privy может быть применен в различных сферах, где риски для конфиденциальности являются приоритетом, включая разработку продуктов с AI, оценку рисков в отраслях, требующих высокого уровня безопасности, и разработка политик в области защиты данных. Инструмент помогает практикам быть более аккуратными в процессе разработки AI-продуктов, улучшая качество и безопасность продуктов. Privy также может способствовать расширению понимания рисков и их минимизации во всех стадиях разработки AI-технологий. ## Выводы Privy доказал свою эффективность в помощи практикам в оценке рисков для конфиденциальности в AI-продуктах. Он улучшает качество рабо

Annotation:

AI creates and exacerbates privacy risks, yet practitioners lack effective resources to identify and mitigate these risks. We present Privy, a tool that guides practitioners through structured privacy impact assessments to: (i) identify relevant risks in novel AI product concepts, and (ii) propose appropriate mitigations. Privy was shaped by a formative study with 11 practitioners, which informed two versions -- one LLM-powered, the other template-based. We evaluated these two versions of Privy ...

ID: 2509.23525v1 cs.HC, cs.AI

arXiv PDF

📄 Bridging the behavior-neural gap: A multimodal AI reveals the brain's geometry of emotion more accurately than human self-reports

2025-10-01

Авторы:

Changde Du, Yizhuo Lu, Zhongyu Huang, Yi Sun, Zisen Zhou, Shaozheng Qin, Huiguang He

#### Контекст Описание эмоций и их нейробиологических оснований является ключевым аспектом понимания человеческого разума и связи. Однако существует затруднение в том, как точно представить эмоции в высокомерной структуре и как эти представления соотносятся с нейробиологическими процессами. Одним из основных вызовов является `behavior-neural gap' (разрыв между поведением и нейробиологией), относительной неэффективностью субъективных самоподготовленных оценок для предсказания нейробиологической активности. В данном исследовании предполагается, что широкомасштабные субъективные оценки могут более точно отражать нейробиологические паттерны, чем стандартные линейные самоподготовленные оценки. #### Метод Исследование основывается на создании и использовании многомодальной большой модели языка (MLLM), а также модели на основе текста (LLM). Методом проведения экспериментов стали опросы с помощью трёхмодальных видео, чтобы собирать многомиллионные трехотсовые оценки пользователей. Модели, выступая как `cognitive agents', предсказывали взаимосвязи между эмоциями в заданиях odd-one-out. Учитывая сложность входных данных, разработали 30-мерные векторные представления, которые отражают эмоциональную структуру. #### Результаты Результаты показали, что MLLM представляет 30-мерную структуру эмоций, которая показала лучшую точность в предсказании нейробиологической активности, выше чем LLM и даже представления, полученные напрямую от поведенческих оценок. Эмбеддинги MLLM соотносятся с нейробиологическими данными процессов эмоций, предлагая более точное представление структуры эмоций. Это демонстрирует, что модели могут автономно формировать богатые представления эмоций, которые лучше соотносятся с нейробиологическими данными. #### Значимость Полученные результаты показывают, что модели могут быть эффективными инструментами для строительства моделей эмоций, которые ближе соответствуют нейробиологическим процессам. Это может иметь значительное значение в области лечения психических расстройств, обучения интеллектуальных систем и понимания связи между человеческим опытом и нейробиологическими механизмами. #### Выводы На основе этих результатов можно сделать вывод, что MLLM-модели способны автономно формировать сложные представления эмоций, лучше соотносящиеся с нейробиологическими данными. На будущее, необходимо продолжать исследования в области связи между поведением, эмоциями и нейробиологическими процессами, используя модели с большим объемом анализа.

Annotation:

The ability to represent emotion plays a significant role in human cognition and social interaction, yet the high-dimensional geometry of this affective space and its neural underpinnings remain debated. A key challenge, the `behavior-neural gap,' is the limited ability of human self-reports to predict brain activity. Here we test the hypothesis that this gap arises from the constraints of traditional rating scales and that large-scale similarity judgments can more faithfully capture the brain's...

ID: 2509.24298v1 cs.HC, cs.AI, cs.CL, cs.CY, cs.MM

arXiv PDF

📄 TraitSpaces: Towards Interpretable Visual Creativity for Human-AI Co-Creation

2025-10-01

Авторы:

Prerna Luthra

## Контекст Область визуального творчества широко рассматривается в умственных и культурных исследованиях, однако автоматизированные методы еще не полностью интегрированы в этот процесс. Особенно актуальным стало исследование взаимодействия людей с искусственным интеллектом в процессах творчества. Одна из основных проблем заключается в необходимости развития интерпретируемых, психологически обоснованных методов моделирования творческих процессов. Исследования в этой области могут помочь в построении моделей, которые бы не только моделировали творческий процесс, но и позволили интерпретировать его в контексте жизней людей и как часть культурных практик. Таким образом, целью данной работы является разработка нового фреймворка для моделирования визуального творчества, который бы был интерпретируемым, обоснованным психологически и включающим в себя различные аспекты творчества. ## Метод Для моделирования визуального творчества был разработан фреймворк, основанный на теориях психологии и интервью с практикующими исскуством. Фреймворк охватывает четыре основных сферы визуального творчества: Inner World (внутренняя сфера), Outer World (наружная сфера), Imaginative World (импровизационная сфера) и Moral World (моральная сфера). Чтобы определить траектории творчества, были выделены двенадцать характеристик, которые перекрывались в культурной, эмоциональной, символической и этической сферах. Для получения данных был использован датасет SemArt, содержащий 20 000 изображений с описаниями, которые были отмечены с помощью GPT-4.1 с помощью теория-ориентированных запросов. Данные были использованы для обучения модели CLIP к распознаванию этих характеристик. Обучение проводилось с использованием различных методов, включая методы классификации и регрессии. ## Результаты Исследования показали, что модель TraitSpaces может точно предсказывать некоторые аспекты творческих процессов, такие как Environmental Dialogicity (общение с окружающим миром) и Redemptive Arc (краска в краску). Такие характеристики были прогнозируемы с высокой достоверностью ($R^2 \approx 0.64 - 0.68$). Однако другие аспекты, такие как Memory Imprint (впечатление памяти), оказались более сложными для прогнозирования, что демонстрирует ограничения исключительно визуальных данных. Также был разработан "траекторий творчества", позволяющий визуализировать и интерпретировать различные виды творческих процессов. Например, по стрелке Redemptive Arc можно рассмотреть работы, которые показывают присутствие временных проблем и их преодоления. ##

Annotation:

We introduce a psychologically grounded and artist-informed framework for modeling visual creativity across four domains: Inner, Outer, Imaginative, and Moral Worlds. Drawing on interviews with practicing artists and theories from psychology, we define 12 traits that capture affective, symbolic, cultural, and ethical dimensions of creativity.Using 20k artworks from the SemArt dataset, we annotate images with GPT 4.1 using detailed, theory-aligned prompts, and evaluate the learnability of these t...

ID: 2509.24326v1 cs.HC, cs.AI, cs.CV

arXiv PDF

📄 Mental Health Impacts of AI Companions: Triangulating Social Media Quasi-Experiments, User Perspectives, and Relational Theory

2025-09-30

Авторы:

Yunhao Yuan, Jiaxun Zhang, Talayeh Aledavood, Renwen Zhang, Koustuv Saha

## Контекст В последние годы AI-powered companion chatbots (AICCs), такие как Replika, приобрели популярность благодаря возможности предоставлять эмпатические интерактивные общения. Однако их психосоциальные последствия остаются недостаточно изученными. Насколько эти системы влияют на благополучие пользователей и как пользователи интерпретируют эти опыты? Мы исследовали эти вопросы, обращая внимание на то, как использование AICCs может повлиять на социальные связи, эмоциональную зрелость и общий благополучие. Наше исследование базируется на трех различных методах: анализе социальных медиа, семиотерического анализа пользовательских интервью и теоретическом подходе, основанном на модели развития отношений. ## Метод Мы применяли три различных метода для изучения данных. В первую очередь, мы проводили крупномасштабный квази-экспериментальный анализ данных социальных медиа, в частности, Reddit, построив стратифицированные пропенсити скор матчинг и используя регрессию Difference-in-Differences. Это позволило нам изучить длительные затрагивающие как эмоциональные аспекты, так и языковые особенности взаимодействий с AICCs. Во вторую очередь, мы проводили 15 семиотерических интервью с пользователями, которые мы тематически анализировали и контекстуализировали с использованием модели развития отношений, разработанной Knapp. Наконец, наши результаты были объединены с теоретической моделью развития отношений, что позволило нам проанализировать развитие знакомства, стабилизации и, возможно, разоружения связи с AICCs. ## Результаты Наши результаты показали смешанные эффекты. Использование AICCs повышало уровень эмоциональной выраженности, читабельности и интерперсональности, но при этом увеличивались выражения одиночества и акцент на темах самоубийств. Мы также обнаружили, что пользователи становятся вовлеченными в три типичных траектории взаимодействия: постепенное построение связи, укрепление и, возможно, отношения становятся зависимыми. Эти сценарии демонстрируют как AICCs могут обеспечивать эмоциональную поддержку, но также создавать риск зависимости и отступления. ## Значимость Наши находки имеют значительные последствия для множества областей. В первую очередь, они могут помочь разработчикам AICCs создавать более эффективные и безопасные инструменты для психосоциальной поддержки. Во-вторых, результаты могут быть полезны для научных исследований в области психологии и социальных сетей, которые изучают влияние цифровых систем на человеческие отношения. Наконец, наши находки могут быть применимы в сфере образования, чтобы помочь людям, которые испытывают одиночество или с

Annotation:

AI-powered companion chatbots (AICCs) such as Replika are increasingly popular, offering empathetic interactions, yet their psychosocial impacts remain unclear. We examined how engaging with AICCs shaped wellbeing and how users perceived these experiences. First, we conducted a large-scale quasi-experimental study of longitudinal Reddit data, applying stratified propensity score matching and Difference-in-Differences regression. Findings revealed mixed effects -- greater affective and grief expr...

ID: 2509.22505v1 cs.HC, cs.AI, cs.CL, cs.CY, stat.AP

arXiv PDF

📄 Does AI Coaching Prepare us for Workplace Negotiations?

2025-09-30

Авторы:

Veda Duddu, Jash Rajesh Parekh, Andy Mao, Hanyi Min, Ziang Xiao, Vedant Das Swain, Koustuv Saha

## Контекст Многие сотрудники сталкиваются с психологическими барьерами во время рабочих переговоров, что может повлиять на их успех. Хотя существуют традиционные методы подготовки к переговорам, включающие в себя традиционные руководства и планирование, новые технологии, такие как ИИ, предлагают альтернативные подходы. Исследователи интересуются, насколько эффективна ИИ-коучинг в подготовке к рабочим переговорам, а также какие психологические удары может оказать такое ИИ-коучинг. ## Метод Для исследования использовались данные, полученные в ходе эксперимента с участием 267 участников. Исследователи сравнили три подхода к подготовке к переговорам: ИИ-коучинг (Trucey), стандартный руководств (Handbook) и ChatGPT. Участники прошли специальные занятия, после чего провели оценку своего уровня страха и подготовки. Также проведены глубокие интервью с 15 участниками, чтобы понять, какие аспекты подготовки оказались для них наиболее эффективными. ## Результаты Заключения эксперимента показали, что ИИ-коучинг (Trucey) сильнее всего снимал страх у участников по сравнению с руководством и ChatGPT. Однако руководство показало себя более эффективным в плане пользовательского опыта и психологической подготовки. В ходе интервью участники отметили, что руководство, благодаря полностью проработанному и проверенному контенту, давало им больше доверия и подготовки. В то же время, ИИ-коучинг, несмотря на свои преимущества в технологиях репетиции, часто оказывался слишком громоздким и непоследовательным в своем подходе, что могло оказываться путающим для участников. ## Значимость Исследование показывает, что ИИ-коучинг может быть полезным для снижения психологического стресса, но не всегда подходит для полной подготовки к переговорам. Изучение этих результатов может помочь в развитии более эффективных методов подготовки к переговорам, которые комбинируют ИИ-технологии и структурированный контент. Это может привести к более полной подготовке сотрудников и повышению их успешности в рабочих переговорах. ## Выводы Результаты исследования подтверждают, что ИИ-коучинг может снизить уровень страха, но не всегда является лучшим вариантом для полной подготовки к переговорам. Необходима разработка гибридных подходов, которые объединяют структурированный контент, технологии репетиции и адаптивные средства, чтобы улучшить подготовку и уменьшить психологический стресс. Будущие исследования должны фокусироваться на создании более эффективных и понятных систем подготовки к перегово

Annotation:

Workplace negotiations are undermined by psychological barriers, which can even derail well-prepared tactics. AI offers personalized and always -- available negotiation coaching, yet its effectiveness for negotiation preparedness remains unclear. We built Trucey, a prototype AI coach grounded in Brett's negotiation model. We conducted a between-subjects experiment (N=267), comparing Trucey, ChatGPT, and a traditional negotiation Handbook, followed by in-depth interviews (N=15). While Trucey show...

ID: 2509.22545v1 cs.HC, cs.AI, cs.CL, cs.CY

arXiv PDF

📄 Adoption, usability and perceived clinical value of a UK AI clinical reference platform (iatroX): a mixed-methods formative evaluation of real-world usage and a 1,223-respondent user survey

2025-09-27

Авторы:

Kolawole Tytler

## Контекст Современная клиническая практика сталкивается с возрастающим объемом биомедицинской литературы и клинических рекомендаций, что создает проблему информационного захламления. Это негативно сказывается на возможности клиников принимать обоснованные решения, основанные на доказательствах. Искусственный интеллект (ИИ), особенно в виде технологий объемных языковых моделей, предлагает возможность автоматизировать поиск и анализ клинической информации, обеспечивая быстрые и проверенные ответы. Несмотря на эту потенцию, эффективность и применяемость таких систем в реальных клинических условиях до сих пор требуют подтверждения. В этом контексте вводится iatroX — новая клиническая система, основанная на технологии реактивной генерации (RAG), разработанная для поддержки клиников в Лондоне. Её целью является предоставление проверенных, ссылкой на источники ответов на клинические вопросы в реальном времени. Данная статья описывает ранние результаты её применения в условиях реальной клинической среды и оценивает её принятие, удобство использования и клиническую ценность. ## Метод Данные для исследования были собраны в течение 16 недель (от 8 апреля до 31 июля 2025 года) с помощью аналитики сайта и мобильных приложений. Использовался скрипт, рандомизировавший опросы пользователей в 10% случаев, чтобы изучить их мнение о системе. Ответы были анализированы с помощью тематического анализа. Также проводился ретроспективный анализ поведения пользователей в приложении, включая метрики посещений, количество запросов и распространение среди мобильных пользователей. ## Результаты Платформа iatroX была оценена по данным от 1,223 клиников. Оценка пользователей показала, что 86.2% считают платформу полезной, 75.0% оценили её точность, а 79.4% — надежность. Более 93% пользователей заявили, что были бы готовы использовать её снова, а 88.4% — рекомендовать другим клиникам. Среди тех, кто принял участие в опросе, значительное количество отметило быстроту и то, что система предоставляет рекомендации, ориентированные на клинические руководства. Мобильные приложения (для iOS и Android) также получили высокую популярность, особенно в средине Android-пользователей. ## Значимость Результаты показывают, что iatroX может помочь клиников бороться с информационным захламлением, предоставляя быстрые, достоверные ответы, которые опираются на клинические руководства. Она может быть использована как инструмент для повышения эффективности и качества клинического решающего процесса. Эти находки имеют потенциал влиять на развитие ИИ в клинической практик

Annotation:

Clinicians face growing information overload from biomedical literature and guidelines, hindering evidence-based care. Retrieval-augmented generation (RAG) with large language models may provide fast, provenance-linked answers, but requires real-world evaluation. We describe iatroX, a UK-centred RAG-based clinical reference platform, and report early adoption, usability, and perceived clinical value from a formative implementation evaluation. Methods comprised a retrospective analysis of usage a...

ID: 2509.21188v1 cs.HC, cs.AI, cs.CY, cs.IR

arXiv PDF

📄 A Longitudinal Randomized Control Study of Companion Chatbot Use: Anthropomorphism and Its Mediating Role on Social Impacts

2025-09-26

Авторы:

Rose E. Guingrich, Michael S. A. Graziano

## Контекст В последние годы возрастает интерес к социальным искусственным интеллектам (СИИ), которые предназначены для создания близких отношений. Особенно популярными стали психологически настраиваемые чатботы, такие как Replika, которые предназначены для сопутствия и социального общения. Однако возникают вопросы о потенциальной влиятельности таких отношений на человеческие взаимоотношения. Необходима подробная исследовательская работа, чтобы определить, как социальная взаимодействие с ЧПУ влияет на человеческие отношения. Настоящее исследование направлено на изучение этих проблем. ## Метод В рамках данного 21-дневного линейного случайного эксперимента участники (N = 183) были случайным образом разделены на две группы: одна группа взаимодействовала с чатботом-компаньоном через текстовые сообщения, а другая группа проходила текстовые игры. Участники выполняли четыре опросника и два аудиозаписанных интервью в течение исследования. Это позволило изучить связь между чатом с чатботом, человечностью (антропоморфизмом) и его влиянием на социальные отношения. ## Результаты Результаты показали, что взаимодействие с чатботом-компаньоном за 21 дней не оказало существенного влияния на социальное здоровье или связи участников по сравнению с контрольной группой. Однако участники, которые выражали большую желанность социального взаимодействия, более антропоморфизировали чатбот. Этот антропоморфизм, в свою очередь, был связан с более сильным воздействием чатбота на социальные отношения участников. Анализ показал, что влияние чатов с чатботом на социальные отношения через 21 дней было сильно зависимым от человечности, которая в свою очередь была связана с желанием взаимодействовать. ## Значимость Находки имеют большое значение для ростова всевозможных приложений социальной ИИ, что позволяет выявить как благие, так и вредные стороны таких инноваций. Оказавшаяся антропоморфизм является ключевым фактором, который влияет на эффективность взаимодействия с чатботом. Результаты могут оказаться полезными для разработчиков социальных ИИ, которым необходимо учитывать тенденции к человечности при проектировании. ## Выводы На основе представленных результатов можно сделать вывод, что взаимодействие с чатботом-компаньоном может не оказывать существенного влияния на социальные отношения, но этот эффект может усиливаться в зависимости от уровня антропоморфизма. Будущие исследования должны исследовать конкретные факторы, которые влияют на человечность чатботов и на способность чатботов влия

Annotation:

Relationships with social artificial intelligence (AI) agents are on the rise. People report forming friendships, mentorships, and romantic partnerships with chatbots such as Replika, a type of social AI agent that is designed specifically for companionship. Concerns that companion chatbot relationships may harm or replace human ones have been raised, but whether and how these social consequences occur remains unclear. Prior research suggests that people's states of social need and their anthrop...

ID: 2509.19515v1 cs.HC, cs.AI, cs.CY

arXiv PDF

📄 PolicyPad: Collaborative Prototyping of LLM Policies

2025-09-26

Авторы:

K. J. Kevin Feng, Tzu-Sheng Kuo, Quan Ze, Chen, Inyoung Cheong, Kenneth Holstein, Amy X. Zhang

## Контекст Политическое управление языковыми моделями (LLM), особенно в высокорисковых областях, становится ключевым вопросом для обеспечения безопасности и эффективности. Во время взаимодействия с этими моделями, знатоки высказывают необходимость быстрого экспериментирования, взаимодействия и итерации в процессе формирования политик. Однако существующие методы порой ограничиваются статичными инструментами и недостаточно подходят для коллективного политического прототипирования. Это подчеркивает необходимость развития инструментов, которые бы поддерживали коллективную работу, эффективность и интерактивность в процессе формирования политик. ## Метод PolicyPad — это интерактивная система, разработанная для поддержки коллективного прототипирования политик для языковых моделей. Основанна на принципах UX-прототипирования, таких как херастический анализ и создание сценариев, она позволяет группам сотрудников совместно работать над прототипами политики в режиме реального времени. Инструмент позволяет пользователям проводить эксперименты с поведением моделей, используя кейсы использования, и мгновенно оценивать их эффективность. Архитектура PolicyPad включает интерактивное окружение, где пользователи могут создавать, редактировать и тестировать политики в симуляционных условиях, что обеспечивает эффективное взаимодействие и быстрое возвращение результатов. ## Результаты Чтобы оценить эффективность PolicyPad, проведены 8 совместных сессий с 22 участниками из областей психологии и права. Участники смогли эффективно создавать и дорабатывать политики, вовлекать в процесс нескольких экспертов и быстро проверять их взаимодействие с моделями. Эксперименты показали, что использование PolicyPad улучшило коллективные динамики в процессе формирования политик, обеспечил быстрые обратные ходы и позволил разработать новые подходы к политическому управлению языковыми моделями. ## Значимость PolicyPad открывает новые возможности для улучшения участия экспертов в процессе формирования политик. Его можно применять в сферах, где требуется высокая точность и безопасность, таких как здравоохранение, право и финансы. Инструмент поддерживает коллективное взаимодействие, обеспечивая туннельные обратные связи и позволяя экспертам быстро адаптироваться к изменениям. Это может способствовать развитию новых подходов к управлению рисками и безопасности в работе с языковыми моделями. ## Выводы PolicyPad — это первый инструмент, который эффективно поддерживает коллективное политическое прототипирование языковых моделей. Он обеспечивает удобные условия для экспериментов, быстрого в

Annotation:

As LLMs gain adoption in high-stakes domains like mental health, domain experts are increasingly consulted to provide input into policies governing their behavior. From an observation of 19 policymaking workshops with 9 experts over 15 weeks, we identified opportunities to better support rapid experimentation, feedback, and iteration for collaborative policy design processes. We present PolicyPad, an interactive system that facilitates the emerging practice of LLM policy prototyping by drawing f...

ID: 2509.19680v1 cs.HC, cs.AI

arXiv PDF

📄 CHOIR: A Chatbot-mediated Organizational Memory Leveraging Communication in University Research Labs

2025-09-26

Авторы:

Sangwook Lee, Adnan Abbas, Yan Chen, Young-Ho Kim, Sang Won Lee

## Контекст В университетских исследовательских лабораториях часто используются чат-платформы для общения и управления проектами. Эти платформы позволяют хранить и обмениваться знаниями, но значительная часть этого знания теряется в бесконечных потоках сообщений. Хотя документирование может помочь сохранить важные знания, оно требует постоянного обновления и трудно поиском. Основываясь на формативных интервью с участниками лабораторий, которые выявили проблемы с организационным памятом, авторы предложили CHOIR – чатбота, основанного на large language model (LLM), который помогает решать эти проблемы. CHOIR предлагает четыре основных функции: справочные вопросы и ответы с использованием документов, общая реакция на вопросы для дальнейшего обсуждения, извлечение знаний из контекста бесед и помощь в обновлении документов с помощью AI. ## Метод CHOIR был разработан и развернут в 4 университетских лабораториях на протяжении месяца. Во время эксперимента участники задали 107 вопросов, которые были обработаны чатботом, и документы были обновлены 38 раз. Задачи и вопросы были записаны в чатбот, а документы обновлялись в лабораториях. Это позволило изучить, каким образом CHOIR может помочь в управлении организационным памятом и какие проблемы могут возникнуть в этом процессе. ## Результаты В результате эксперимента было выявлено, что CHOIR успешно помогал в поиске информации, но также выявились некоторые проблемы. В частности, участники часто задавали вопросы в приватном режиме, что ограничивало видимость потенциальных пробелов в документации для руководителей лабораторий. Также было замечено, что студенты часто не хотели добавлять свои вклады в документацию из-за сложностей с общеутвержденным характером своих личных опытов. Эти результаты показывают, что CHOIR может стать полезным инструментом, но требуются дополнительные улучшения для решения этих проблем. ## Значимость CHOIR может быть применен в различных сферах, где важно сохранение и доступ к организационным знаниям. Он может быть полезен для командных проектов, в образовательных процессах и в любой другой сфере, где требуется постоянное обновление и доступ к знаниям. CHOIR может улучшить производительность работы команд, экономящих время и усилий на поиск и обновление документов. ## Выводы В результате исследования было показано, что CHOIR может помочь в сохранении и управлении организационным памятом в университетских лабораториях. Однако необходимо совершить дополнительные усилия, чтобы улучшить возможности CHOIR в обеспечении приватности и поддержки контекстуальных знаний. Будущие

Annotation:

University research labs often rely on chat-based platforms for communication and project management, where valuable knowledge surfaces but is easily lost in message streams. Documentation can preserve knowledge, but it requires ongoing maintenance and is challenging to navigate. Drawing on formative interviews that revealed organizational memory challenges in labs, we designed CHOIR, an LLM-based chatbot that supports organizational memory through four key functions: document-grounded Q&A, Q&A ...

ID: 2509.20512v1 cs.HC, cs.AI

arXiv PDF

📄 Perspectra: Choosing Your Experts Enhances Critical Thinking in Multi-Agent Research Ideation

2025-09-26

Авторы:

Yiren Liu, Viraj Shah, Sangho Suh, Pao Siangliulue, Tal August, Yun Huang

## Контекст Одним из самых захватывающих направлений в ИИ является развитие мультиагентских систем (MAS), которые способны взаимодействовать друг с другом для решения сложных задач. Несмотря на прогресс в этой области, остается актуальным вопрос о том, как лучше всего контролировать и управлять коллективным размышлением агентов, чтобы повысить качество решений. Например, в области критического мышления возникает проблема, как помочь пользователям эффективно управлять интерактивными системами, вовлеченными в многоагентские дискуссии. Этот вопрос исследовался в рамках разработки Perspectra, интерактивной машины с многоагентскими системами, которая предлагает способы улучшения критического мышления при работе с мультиагентными системами. ## Метод Perspectra представляет собой интерактивную платформу, где несколько децентрализованных агентов, каждый из которых представляет собой личность с определенным экспертным опытом, взаимодействуют в формате форума. Агентам можно направлять полезные вопросы и замечания, приглашая их в дискуссию с помощью @-упоминаний. Ответы агентов хранятся в виде разделенных тем, чтобы обеспечить последовательность и понятность в решении задач. Также, Perspectra включает в себя визуальные средства — например, визуальный ментальный карта, который демонстрирует развитие аргументов и логическую структуру дискуссии. Эта архитектура позволяет пользователям управлять дальнейшим развитием дискуссии и постоянно развивать критическое мышление. ## Результаты В эксперименте, проведенном с 18 участниками, были сравнены уровни критического мышления при использовании Perspectra и традиционного базового подхода (групповый чат). Участники, использовавшие Perspectra, проявили более высокий уровень критического мышления. Они задавали более глубокие вопросы, активнее использовали контекстные факты, что приводило к более интеллектуальному обсуждению. Также, Perspectra способствовала большему числу интердисциплинарных вкладов, что улучшило качество полученных проектов. Кроме того, пользователи Perspectra чаще вносили изменения в свои решения, что указывает на более гибкую и критическую оценку своих работ. ## Значимость Полученные результаты показывают, что Perspectra может быть применена в различных областях, где требуется высокий уровень критического мышления — например, в образовательных программах, дизайне решений, разработке технологий. Эта система позволяет пользователям контролировать диалог с несколькими агентами, что повышает возможности для критического анализа и развития мыслительных навыков. Благодаря этому, Perspectra может стать основой для раз

Annotation:

Recent advances in multi-agent systems (MAS) enable tools for information search and ideation by assigning personas to agents. However, how users can effectively control, steer, and critically evaluate collaboration among multiple domain-expert agents remains underexplored. We present Perspectra, an interactive MAS that visualizes and structures deliberation among LLM agents via a forum-style interface, supporting @-mention to invite targeted agents, threading for parallel exploration, with a re...

ID: 2509.20553v1 cs.HC, cs.AI, cs.CL

arXiv PDF

1
2
10
11
12
13
14
23
24

Показано 111 - 120 из 239 записей