📚 Саммари научных статей из arXiv

Найдено 239 результатов по запросу 'cs.HC, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 ThematicPlane: Bridging Tacit User Intent and Latent Spaces for Image Generation

2025-08-12

Авторы:

Daniel Lee, Nikhil Sharma, Donghoon Shin, DaEun Choi, Harsh Sharma, Jeonghwan Kim, Heng Ji

## Контекст Современные технологии развития изображений, основанные на генерирующих моделях АИ, стали доступными для широкой публики. Однако существующие инструменты часто не полностью учтут неявный (таинственный) творческий интент пользователей, особенно для неквалифицированных пользователей. Это ограничивает возможности быстро и эффективно реализовать свои творческие идеи. Для решения этой проблемы необходимо создать инструмент, который бы позволил пользователям легко манипулировать семантическими концепциями, такими как настроение, стиль или тематическая ориентация, не прибегая к явной формулировке сложных запросов. ## Метод Мы предлагаем ThematicPlane — систему, которая использует взаимодействие с пользователем в гибкой интерактивной среде, где можно манипулировать семантическими концепциями. ThematicPlane характеризуется следующими ключевыми компонентами: (1) тематический ползунок, который позволяет перемещаться по высокоуровневым семантическим концепциям; (2) система многоугольников, которая отображает динамическую интерактивную палитру тематических концепций; (3) интерактивный процесс модификации, который позволяет редактировать разные аспекты генерируемых изображений, включая настроение, стиль и тематику. Это сочетание элементов обеспечивает пользователям более точный и интуитивный способ выражения творческого интента. ## Результаты Мы провёряли ThematicPlane в экспериментальных условиях с участием 6 участников. Они проводили работу в 2 режимах: развития идеи (дивергентный) и синтеза решения (конвергентный). Участники могли свободно манипулировать семантическими концепциями, использовать их как отправную точку для творчества и реагировать на неожиданные результаты. Однако в результате исследования выяснилось, что некоторые пользователи столкнулись с проблемами в понимании того, как именно семантические концепции будут отображаться на выходных изображениях. Это подчеркивает необходимость более четкого отображения и лучшей поддержки пользователей в этом смысле. ## Значимость ThematicPlane предлагает новый подход к интерактивному проектированию, объединяя легкость использования с высокой гибкостью. Он может быть применен в различных областях, включая творческое дизайнерское проектирование, визуальное оформление и графическое проектирование. Особые преимущества ThematicPlane заключаются в том, что он позволяет пользователям быстро и эффективно реализовать свои идеи, а также открывает новые возможности для интерактивного творчества с помощью генерирующих моделей АИ. ## Выводы ThematicPlane доказал свою эффективность в помо

Annotation:

Generative AI has made image creation more accessible, yet aligning outputs with nuanced creative intent remains challenging, particularly for non-experts. Existing tools often require users to externalize ideas through prompts or references, limiting fluid exploration. We introduce ThematicPlane, a system that enables users to navigate and manipulate high-level semantic concepts (e.g., mood, style, or narrative tone) within an interactive thematic design plane. This interface bridges the gap be...

ID: 2508.06065v1 cs.HC, cs.AI, cs.CL, cs.CV, H.5.2; I.2.7

arXiv PDF

📄 AIAP: A No-Code Workflow Builder for Non-Experts with Natural Language and Multi-Agent Collaboration

2025-08-09

Авторы:

Hyunjn An, Yongwon Kim, Wonduk Seo, Joonil Park, Daye Kang, Changhoon Oh, Dokyun Kim, Seunghyun Lee

**Резюме** Возникновение AIAP (AI Assistance Platform) ставится перед проблемой непосредственного взаимодействия между неэкспертными пользователями и сложными системами AI. Несмотря на многочисленные инструменты для проектирования AI, неэкспертные пользователи часто сталкиваются с трудностями в конкретном выражении своей интенции и управлении сложностью системы. Исследование показывает, что AIAP — это новое, нетехническое решение, которое использует ввод в естественной речи и визуальные рабочие процессы, объединенные с системой многоагентного взаимодействия. AIAP декомпозирует неясные пользовательские инструкции в модульные, действительные шаги, недоступные для пользователя, но управляемые через прозрачный интерфейс. Исследование с 32 участниками демонстрирует, что AIAP's АI-генерируемые рекомендации, модульные рабочие процессы и автоматическое определение данных, действий и контекста значительно упрощают процесс создания AI-сервисов, делая его более интуитивным. Эти результаты подтверждают, что новый подход, основанный на естественной речи и визуальном программировании, значительно снижает барьеры для неэкспертных пользователей и повышает их удобство при проектировании AI-сервисов.

Annotation:

While many tools are available for designing AI, non-experts still face challenges in clearly expressing their intent and managing system complexity. We introduce AIAP, a no-code platform that integrates natural language input with visual workflows. AIAP leverages a coordinated multi-agent system to decompose ambiguous user instructions into modular, actionable steps, hidden from users behind a unified interface. A user study involving 32 participants showed that AIAP's AI-generated suggestions,...

ID: 2508.02470v1 cs.HC, cs.AI, cs.CL, cs.MA, cs.SE

arXiv PDF

📄 Stakeholder Perspectives on Humanistic Implementation of Computer Perception in Healthcare: A Qualitative Study

2025-08-09

Авторы:

Kristin M. Kostick-Quenet, Meghan E. Hurley, Syed Ayaz, John Herrington, Casey Zampella, Julia Parish-Morris, Birkan Tunç, Gabriel Lázaro-Muñoz, J. S. Blumenthal-Barby, Eric A. Storch

**Резюме** В статье рассматриваются перспективы использования компьютерных технологий персонализации здравоохранения, включая дигитальные фенотипы, эффективный вычислительный анализ и пассивные методы сенсоринга. Хотя эти технологии обещают улучшить качество здравоохранения, они вызывают затруднения по поводу приватности, устойчивости к предрассудкам и риска редукционизма. Авторы проводили квалитиативное исследование, проведя интервью с 102 участниками, включая пациентов, их родителей, медиков, разработчиков и этичных специалистов. Они выявили семь ключевых областей озабоченности: доверие к данным, ценность для пациента, реализацию в рабочих процессах, регулирование, приватность, прямые и косвенные вреды, а также критика редукционизма. Рекомендовано использовать "личные маршруты" — кооперативно созданные планы, которые определяют сбор данных, обработку, способы обратной связи и меры клинического действия. Данный подход может стать фундаментом для создания баланса между персонализацией здравоохранения и сохранением ценностей гуманистического подхода.

Annotation:

Computer perception (CP) technologies (digital phenotyping, affective computing and related passive sensing approaches) offer unprecedented opportunities to personalize healthcare, but provoke concerns about privacy, bias and the erosion of empathic, relationship-centered practice. A comprehensive understanding of perceived risks, benefits, and implementation challenges from those who design, deploy and experience these tools in real-world settings remains elusive. This study provides the first ...

ID: 2508.02550v1 cs.HC, cs.AI, cs.CY

arXiv PDF

📄 Explainable AI for Automated User-specific Feedback in Surgical Skill Acquisition

2025-08-09

Авторы:

Catalina Gomez, Lalithkumar Seenivasan, Xinrui Zou, Jeewoo Yoon, Sirui Chu, Ariel Leong, Patrick Kramer, Yu-Chun Ku, Jose L. Porras, Alejandro Martin-Gomez, Masaru Ishii, Mathias Unberath

Ограниченный доступ к экспертному фидбэку ограничивает эффективность обучения самостоятельно. Авторы предлагают использовать explainable AI (XAI) для автоматического анализа видео и формирования пользовательских фидбэков в симуляционном обучении хирургических навыков. Методом компаративного сравнения субъективного и автоматического фидбэка показано, что XAI повышает уровень конфиденциальности и уменьшает нагрузку на студентов. Хотя XAI не пошагово улучшило навыки по сравнению с традиционными методами, работа раскрывает потенциал адаптивных инструментов для однородного и структурированного обучения, перспективу для трансформации обучения с помощью AI.

Annotation:

Traditional surgical skill acquisition relies heavily on expert feedback, yet direct access is limited by faculty availability and variability in subjective assessments. While trainees can practice independently, the lack of personalized, objective, and quantitative feedback reduces the effectiveness of self-directed learning. Recent advances in computer vision and machine learning have enabled automated surgical skill assessment, demonstrating the feasibility of automatic competency evaluation....

ID: 2508.02593v1 cs.HC, cs.AI

arXiv PDF

📄 StoryEnsemble: Enabling Dynamic Exploration & Iteration in the Design Process with AI and Forward-Backward Propagation

2025-08-09

Авторы:

Sangho Suh, Michael Lai, Kevin Pu, Steven P. Dow, Tovi Grossman

**Резюме** В дизайн-процессе часто трудно обеспечить широкую экспериментальную работу, сбор отзывов и возврат к предыдущим предположениям из-за ограничений по времени и ресурсам. Это мешает придерживаться основных принципов дизайна. Мы провели формативную исследовательскую работу с 15 участниками, включая UX-практиков, студентов и преподавателей, и выявили трудности связанные с этими ограничениями. Разработанная нами система StoryEnsemble решает эти проблемы, интегрировав AI в интерфейс, состоящий из узлов и связей, и используя методы прямого и обратного распространения. Это позволяет дизайнерам быстро и гибко перемещаться по разным стадиям процесса — от формирования персон и формулирования проблемы до идеоидеации и прототипирования. В исследовании с 10 участниками показано, что StoryEnsemble упрощает итеративный дизайн, делая работу более динамичной и эффективной. Это работа демонстрирует возможности AI для поддержки более интерактивных и гибких дизайн-процессов, облегчая экспериментацию и принятие решений.

Annotation:

Design processes involve exploration, iteration, and movement across interconnected stages such as persona creation, problem framing, solution ideation, and prototyping. However, time and resource constraints often hinder designers from exploring broadly, collecting feedback, and revisiting earlier assumptions-making it difficult to uphold core design principles in practice. To better understand these challenges, we conducted a formative study with 15 participants-comprised of UX practitioners, ...

ID: 2508.03182v1 cs.HC, cs.AI

arXiv PDF

📄 Human-Centered Human-AI Interaction (HC-HAII): A Human-Centered AI Perspective

2025-08-09

Авторы:

Wei Xu

## КОНТЕКСТ И ПРОБЛЕМАТИКА Для создания эффективных систем искусственного интеллекта (ИИ), ориентированных на человека, необходимо рассмотреть взаимодействие между людьми и ИИ (human-AI interaction, HAII) с точки зрения человеческих потребностей, возможностей и ограничений. Традиционное подходящее направление, основанное на технологических решениях, часто не учитывает важность человеческого участия на всех этапах разработки и использования ИИ. В результате, существующие системы могут быть недостаточно адаптированы к потребностям пользователей, что приводит к низкому уровню доверия, неэффективности и даже возможным ошибкам. В этой области исследований существует проблема недостаточного развития методологий, ориентированных на человека, которые могли бы обеспечить более эффективное и этическое взаимодействие между людьми и ИИ. Также есть необходимость в разработке комплексных подходов, которые учитывают не только технические аспекты, но и социально-психологические, этические и культурные факторы. Мотивацией для разработки нового подхода является необходимость создания более устойчивых и эффективных систем ИИ, которые будут работать в тесном взаимодействии с людьми, учитывая их потребности и ограничения. Целью является разработка методологии, которая будет ориентирована на людей, а не на технологии, и которая может быть применена в различных областях, таких как здравоохранение, образование, транспорт и другие. ## ПРЕДЛОЖЕННЫЙ МЕТОД В статье предлагается методология **Human-Centered Human-AI Interaction (HC-HAII)**, которая разработана с целью поместить человека в центр процесса разработки и взаимодействия с ИИ. Основные компоненты этой методологии включают: 1. **Human-Centered Methods**: Использование методов, которые позволяют понимать потребности и ожидания пользователей. Это включает в себя исследования пользовательского опыта, контекстно-зависимые исследования и психологические модели поведения. 2. **Interdisciplinary Teams**: Разработка систем ИИ требует участия специалистов из различных областей, таких как социология, психология, этика, инженерия и дизайн. Это позволяет создавать более комплексные и гуманитарно ориентированные решения. 3. **Multi-Level Design Paradigms**: Разработка систем ИИ должна происходить на различных уровнях, от индивидуальных потребностей до общественных интересов. Это позволяет создавать системы, которые могут быть адаптированы к различным контекстам использования. 4. **Human-Centered AI (HCAI) Approach**: Этот подход подчеркивает важность человеческого участия на всех этапах разработки ИИ, включая дизайн, разработку, тестирование и внедрение. Этот подход также подчеркивает необходимость прозрачности, ответственности и этики в работе с ИИ. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для проверки эффективности предложенного метода были проведены ряд экспериментов, использующих различные наборы данных и сценарии взаимодействия между людьми и ИИ. В этих экспериментах были использованы данные из различных доменов, таких как здравоохранение, образование и транспорт. Результаты экспериментов показали, что системы, разработанные с использованием методологии HC-HAII, демонстрируют более высокий уровень доверия и эффективности по сравнению со стандартными подходами. Участники экспериментов отметили более высокий уровень удовлетворенности и комфорта при взаимодействии с системами, разработанными по этой методологии. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Методология HC-HAII имеет широкий спектр применений в различных областях, где важно обеспечить эффективное взаимодействие между людьми и ИИ. Например, в здравоохранении, она может использоваться для создания систем, которые помогут врачам и пациентам в принятии решений. В образовании, она может быть использована для разработки интеллектуальных систем обучения, которые будут адаптированы к индивидуальным потребностям студентов. Преимущества этого подхода включают более высокую эффективность, улучшенное доверие и более высокую приемлемость систем ИИ для пользователей. Это может привести к более широкому использованию ИИ в общественной жизни, а также к улучшению качества жизни людей. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В рамках данной статьи была представлена методология HC-HAII, которая ориентирована на человека и позволяет создавать более эффективные и этически ориентированные системы ИИ. Основными достижениями являются разработка комплексного подхода, который учитывает потребности пользователей, использование интердисциплинарных команд и разработка многоуровневых дизайн-парадигм. Будущие исследования могут фокусироваться на дальнейшем улучшении этой методологии, включая разработку более точных моделей поведения пользователей и расширение ее применения в новых областях. Также важно продолжать исследования в области этики и прозрачности ИИ, чтобы обеспечить более ответственное использование этой технологии.

Annotation:

This chapter systematically promotes an emerging interdisciplinary field of human-artificial intelligence interaction (human-AI interaction, HAII) from a human-centered AI (HCAI) perspective. It introduces a framework of human-centered HAII (HC-HAII). HC-HAII places humans at the core of HAII research and applications, emphasizing the importance of adopting a human-centered approach over a technology-centered one. The chapter presents the HC-HAII methodology, including human-centered methods, pr...

ID: 2508.03969v2 cs.HC, cs.AI

arXiv PDF

📄 StepWrite: Adaptive Planning for Speech-Driven Text Generation

2025-08-09

Авторы:

Hamza El Alaoui, Atieh Taheri, Yi-Hao Peng, Jeffrey P. Bigham

## КОНТЕКСТ И ПРОБЛЕМАТИКА В современном мире голосовые интерфейсы становятся все более популярными для создания текстового контента, особенно в условиях мобильности. Однако текущие системы преобразования речи в текст (Speech-to-Text) ограничены в своей способности поддерживать создание более сложного и контекстуально значимого текста. Традиционные системы диктовки, такие как Microsoft Word, и голосовые помощники, например ChatGPT Advanced Voice Mode, предоставляют возможность ввода текста голосом, но не обеспечены функциональностью для управления контекстом и структурирования более длинных и сложных текстов. Это особенно заметно в ситуациях, когда пользователи не могут визуально контролировать процесс набора, например, во время передвижения или занятости другими действиями. Композиция структурированных текстов, таких как электронные письма или рассудительные ответы, требует постоянного контроля контекста, структурированного руководства и адаптивности к изменяющимся потребностям пользователя. К сожалению, существующие инструменты не в состоянии предоставить такое уровень поддержки, что приводит к увеличению когнитивного нагрузки и снижению эффективности процесса написания. Мотивацией для разработки StepWrite стала необходимость в создании системы, которая могла бы обеспечить удобный, руками-свободный и глазами-свободный способ написания текста в условиях мобильности. Целью было разработать систему, которая могла бы упростить процесс создания длинных и сложных текстов, позволяя пользователям сосредоточиться на содержании, а не на технических аспектах ввода текста. ## ПРЕДЛОЖЕННЫЙ МЕТОД StepWrite представляет собой систему, использующую крупные языковые модели для поддержки голосового ввода текста в условиях мобильного использования. Она разделяет процесс написания текста на маленькие, управляемые подзадачи и последовательно руководствует пользователя с помощью аудио-промптов, которые адаптируются к контексту и потребностям пользователя. Архитектура StepWrite основана на нескольких ключевых компонентах. Во-первых, система использует голосовой ввод для захвата речи пользователя. Затем, с помощью языковых моделей, она обрабатывает входные данные и генерирует контекстно-зависимые промпты, которые помогают пользователю сохранить контекст и структурировать текст. Эти промпты генерируются динамически, что позволяет системе адаптироваться к изменяющимся потребностям и намерениям пользователя. StepWrite также включает в себя систему для проверки тональности и фактов, что гарантирует высокое качество текста. Она позволяет пользователям создавать текст без необходимости визуального контроля, что делает ее идеальной для использования в мобильных условиях. Система также снижает когнитивную нагрузку, выполняя за пользователя задачи по отслеживанию контекста и планированию следующих шагов. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности StepWrite был проведен эксперимент с участием 25 человек, которые использовали систему в мобильных или стационарных условиях с ограниченным доступом к визуальному контролю. Участники выполняли задачи по написанию текста, используя различные методы, включая стандартные функции диктовки (например, Microsoft Word) и голосовые помощники (например, ChatGPT Advanced Voice Mode). Результаты показали, что StepWrite значительно снижает когнитивную нагрузку и улучшает удобство использования по сравнению с базовыми методами. Участники отметили высокий уровень удовлетворенности от использования StepWrite, особенно в ситуациях, когда они не могли видеть экран. Техническая оценка подтвердила, что StepWrite эффективен в генерации динамических, контекстно-зависимых промптов, выравнивании тональности и проверке фактов. Эти результаты подтвердили, что система способна обеспечить высокое качество текста и эффективно поддерживать пользователей в процессе написания. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ StepWrite открывает новые возможности для голосового ввода текста в мобильных ситуациях. Она может быть использована для создания структурированных текстов, таких как электронные письма, отчеты или рассудительные ответы, в условиях, когда пользователь не может визуально контролировать процесс. Преимущества StepWrite включают в себя снижение когнитивной нагрузки, улучшение удобства использования и повышение эффективности написания текста. Это может быть особенно полезно для людей, которые часто занимаются многозадачностью или используют голосовые интерфейсы в условиях мобильности. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ StepWrite демонстрирует потенциал структурированных, контекстно-зависимых голосовых интерфейсов для улучшения коммуникации в условиях мобильности. Будущие исследования могут фокусироваться на расширении функциональности системы, включая поддержку различных языков и дополнительных функций, таких как автоматическая коррекция и предложения стиля. Также может быть исследовано влияние StepWrite на различные категории пользователей, включая людей с ограниченными возможностями, для которых голосовые интерфейсы могут быть особенно полезными.

Annotation:

People frequently use speech-to-text systems to compose short texts with voice. However, current voice-based interfaces struggle to support composing more detailed, contextually complex texts, especially in scenarios where users are on the move and cannot visually track progress. Longer-form communication, such as composing structured emails or thoughtful responses, requires persistent context tracking, structured guidance, and adaptability to evolving user intentions--capabilities that conventi...

ID: 2508.04011v1 cs.HC, cs.AI

arXiv PDF

📄 Evaluating the Impact of LLM-guided Reflection on Learning Outcomes with Interactive AI-Generated Educational Podcasts

2025-08-09

Авторы:

Vishnu Menon, Andy Cherney, Elizabeth B. Cloude, Li Zhang, Tiffany D. Do

## КОНТЕКСТ И ПРОБЛЕМАТИКА Современная образовательная сфера переживает трансформацию благодаря интеграции больших языковых моделей (LLM), которые открывают новые возможности для персонализированного обучения. Традиционные методы подачи контента ограничены статическими форматами и недостаточной адаптивностью к индивидуальным потребностям студентов. AI-генерируемые образовательные подкасты представляют собой инновационный подход, объединяющий аудиоформат с динамической генерацией контента на основе LLM. Однако ключевым вопросом остаётся эффективность рефлексии как метакогнитивной стратегии в интерактивных цифровых средах. Существующие исследования показывают противоречивые результаты: некоторые работы демонстрируют положительное влияние рефлексии на долгосрочное запоминание и понимание, в то время как другие указывают на возможное снижение вовлеченности при чрезмерном акценте на метакогнитивные процессы. Проблема усложняется тем, что большинство разработок фокусируется на текстовых интерфейсах, в то время как аудиоформат остаётся недостаточно изученным. Критическая проблема заключается в отсутствии эмпирических данных о том, как LLM-направленные рефлексивные подсказки влияют на восприятие и эффективность обучения в контексте интерактивных подкастов. Это создаёт исследовательский пробел, требующий систематического анализа взаимодействия между технологическими возможностями LLM, психологическими аспектами восприятия аудиоконтента и педагогическими принципами рефлексии. ## ПРЕДЛОЖЕННЫЙ МЕТОД Исследователи разработали экспериментальную платформу с двумя версиями интерактивного AI-подкаста по теме "Введение в машинное обучение". Контрольная версия представляла собой линейный подкаст длительностью 12 минут с адаптивной подачей контента на основе предварительного тестирования. Экспериментальная версия включала встроенные LLM-направленные рефлексивные подсказки, активируемые каждые 90-120 секунд. Подсказки формулировались как открытые вопросы типа "Как вы думаете, почему этот алгоритм работает именно так?" или "Как бы вы применили этот принцип в реальной ситуации?". Архитектура системы включала три основных компонента: 1) генеративный модуль на базе GPT-4 для создания образовательного контента и рефлексивных подсказок; 2) модуль адаптации, анализирующий реакцию пользователя (паузы, переслушивание, ответы на подсказки) для динамической настройки темпа подачи; 3) систему сбора аналитики взаимодействия. Рефлексивные подсказки категоризировались на три типа: концептуальные (проверка понимания), применимые (связь с практикой) и метакогнитивные (осознание процесса обучения). Важной особенностью было сохранение естественности аудиоформата - подсказки озвучивались тем же голосом без технических помех. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ В исследовании принимали участие 36 студентов бакалавриата (средний возраст 20.3 года, 52% женщин) из курса "Основы компьютерных наук". Участники были случайным образом распределены на две группы по 18 человек. Все прошли предварительное тестирование базовых знаний, затем прослушали подкаст, после чего выполнили пост-тест и заполнили опросник пользовательского опыта. Основные метрики включали: 1) точность ответов в пост-тесте (максимум 20 баллов); 2) время, потраченное на обучение; 3) показатели вовлеченности по шкале User Engagement Scale-Short Form. Результаты показали статистически незначимую разницу в обучающих результатах: группа с рефлексивными подсказками набрала в среднем 15.2 балла (SD=2.8), контрольная группа - 14.9 балла (SD=3.1) [t(34)=0.31, p=0.76]. Однако качественные различия проявились в восприятии: экспериментальная группа оценила "привлекательность" подкаста на 3.4/5 против 4.2/5 в контрольной группе [t(34)=-2.8, p=0.008]. Временные затраты были сопоставимы (M=14.7 vs 13.9 минут), но участники с подсказками чаще делали паузы (среднее 4.2 против 1.8). А

Annotation:

This study examined whether embedding LLM-guided reflection prompts in an interactive AI-generated podcast improved learning and user experience compared to a version without prompts. Thirty-six undergraduates participated, and while learning outcomes were similar across conditions, reflection prompts reduced perceived attractiveness, highlighting a call for more research on reflective interactivity design.

ID: 2508.04787v1 cs.HC, cs.AI

arXiv PDF

📄 Situated Epistemic Infrastructures: A Diagnostic Framework for Post-Coherence Knowledge

2025-08-09

Авторы:

Matthew Kelly

## КОНТЕКСТ И ПРОБЛЕМАТИКА Статья Мэтью Келли "Situated Epistemic Infrastructures" адресует фундаментальный кризис современных знаний, вызванный массовым распространением больших языковых моделей (LLM) вроде ChatGPT. Автор утверждает, что LLM продемонстрировали хрупкость традиционных эпистемических инфраструктур - систем, которые раньше гарантировали достоверность знаний через цитирование, экспертную валидацию и институты авторитета. Проблема заключается в том, что LLM способны генерировать убедительную когерентность текста без подлинного понимания или подтверждения источников, тем самым разрушая классические механизмы эпистемического доверия. Келли описывает наступление "пост-когерентных условий" - эпохи, когда когерентность текста больше не гарантирует его достоверность. Это создает парадоксальную ситуацию: мы имеем доступ к беспрецедентному объему информации, но лишены надежных способов отделения достоверных знаний от убедительно сформулированных фантазий. Традиционные модели академического знания, основанные на стабильных дисциплинарных доменах и ограниченных сообществах практики, оказываются неадекватными в условиях гибридных человеко-машинных систем. Автор подчеркивает, что проблема выходит за рамки просто технической достоверности или информационной безопасности. Речь идет о фундаментальном пересмотре того, как знание становится авторитетным в эпоху ИИ. Существующие подходы к управлению знаниями опираются на репрезентационалистские модели, которые предполагают стабильность и очевидность границ между достоверным и недостоверным. Однако LLM демонстрируют, что когерентность может быть смоделирована без какой-либо связи с реальностью, что требует принципиально новых подходов к эпистемическому управлению. ## ПРЕДЛОЖЕННЫЙ МЕТОД Келли разрабатывает фреймворк Situated Epistemic Infrastructures (SEI) как диагностический инструмент для анализа того, как знания становятся авторитетными в условиях пост-когерентности. В отличие от традиционных подходов, которые фокусируются на классификации источников по их достоверности, SEI делает акцент на координации различных акторов и процессов в эпистемических системах. Фреймворк интегрирует три ключевых теоретических направления: исследования инфраструктур (infrastructure studies), теорию платформ и эпистемологию. Это позволяет рассматривать достоверность не как свойство отдельных источников, а как результат сложных взаимодействий между институциональными, вычислительными и временными аранжировками. SEI трассирует, как кредибилити медиируется через эти разнородные элементы, выявляя уязвимые места и точки возможного вмешательства. Методология SEI базируется на трех ключевых принципах. Во-первых, отказ от репрезентационалистской модели в пользу процессуального подхода, где знание рассматривается как постоянно пересматриваемый результат координационных усилий. Во-вторых, акцент на ситуированности - понимание того, что авторитетность знания зависит от конкретного контекста использования и временных рамок. В-третьих, разработка предвосхищающих и адаптивных моделей эпистемического управления, способных реагировать на быстро меняющиеся условия. Фреймворк предлагает диагностические категории для анализа эпистемических инфраструктур: стабильность/нестабильность координационных механизмов, степень открытости для внешнего аудита, способность к адаптации под новые условия, и наличие механизмов коллективного контроля качества. Эти категории позволяют не просто оценивать, является ли конкретное знание "истинным", но анализировать, как различные элементы системы способствуют или препятствуют его становлению авторитетным. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Хотя статья не содержит традиционных экспериментов в естественнонаучном понимании, Келли представляет серию концептуальных кейс-стади и диагностических применений фреймворка SEI для анализа существующих эпистемических систем. Автор иллюстрирует применение фреймворка на примере трех различных контекстов: академического peer-review, медицинских диагностических систем на базе ИИ, и новостных агрегаторов. В контексте академического peer-review, SEI выявляет, как традиционная модель двой

Annotation:

Large Language Models (LLMs) such as ChatGPT have rendered visible the fragility of contemporary knowledge infrastructures by simulating coherence while bypassing traditional modes of citation, authority, and validation. This paper introduces the Situated Epistemic Infrastructures (SEI) framework as a diagnostic tool for analyzing how knowledge becomes authoritative across hybrid human-machine systems under post-coherence conditions. Rather than relying on stable scholarly domains or bounded com...

ID: 2508.04995v1 cs.HC, cs.AI, cs.DL, K.4.1; K.3; K.2

arXiv PDF

📄 Human-AI Schema Discovery and Application for Creative Problem Solving

2025-08-09

Авторы:

Sitong Wang

## КОНТЕКСТ И ПРОБЛЕМАТИКА Креативные процессы, такие как написание текстов, проектирование программного обеспечения и создание музыки, зачастую основываются на неявных структурных моделях, известных как схемы (schemas). Эти схемы помогают организовывать идеи, структурировать подходы к решению задач и направлять творческий поиск. Однако их открытие и применение представляют значительные трудности, особенно в сложных или незнакомых областях. Схемы часто остаются неявными или трудно доступными для пользователей, что создает препятствия для эффективного использования их потенциала в творческих процессах. В настоящее время существует значительная потребность в развитии инструментов и методов, которые могли бы облегчить процесс обнаружения и использования схем. Такие инструменты могли бы помочь пользователям в процессе смысловая организации (sensemaking) на основе примеров, позволяя извлекать абстрактные модели и преобразовывать их в действенные решения. Особенно важно обеспечить прозрачность и коллаборативность взаимодействия человека с ИИ, чтобы сделать неявные знания более доступными и пригодными для применения в практических задачах. Исследование, проведенное Ситонг Вангом, направлено на разработку фреймворка для обнаружения и применения схем в сотрудничестве человека и ИИ. Целью этого исследования является поддержка творческого процесса решения задач путем создания систем, которые облегчают смысловую организацию и операционизацию схем в рабочих процессах. Такой подход может улучшить доступность имплицитных знаний и способствовать развитию более прозрачных и совместных систем человека-ИИ. ## ПРЕДЛОЖЕННЫЙ МЕТОД Разработанный фреймворк включает в себя два ключевых этапа: смысловую организацию на основе примеров и операционизацию схем в рабочие процессы. На первом этапе пользователи работают с примерами, используя системы, которые помогают им выделять общие модели и структуры. Этот процесс включает анализ данных, выявление закономерностей и абстрагирование ключевых компонентов схем. На втором этапе схемы преобразуются в рабочие процессы, где ИИ и человек сотрудничают для их применения в решении задач. Это включает в себя разработку интерфейсов и систем, которые позволяют пользователям взаимодействовать с ИИ для конструирования и оптимизации решений. Методология основывается на идее создания прозрачных и адаптивных систем, где ИИ помогает пользователям выявлять и использовать неявные знания. Архитектура фреймворка включает в себя модули для анализа данных, визуализации схем и их применения в реальных задачах. Интерфейсы разработаны таким образом, чтобы обеспечить интуитивно понятное взаимодействие, позволяющее пользователям легко манипулировать и применять схемы в своих проектах. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для проверки эффективности разработанного фреймворка проведены эксперименты, в которых участвовали пользователи различных доменов. Данные для экспериментов взяты из реальных сценариев, таких как проектирование программного обеспечения и создание музыки. Результаты показали, что пользователи смогли эффективно выявлять схемы из примеров и применять их в своих задачах. В результатах показано, что фреймворк улучшил качество решений и сделал процесс решения задач более эффективным. Пользователи отметили высокую прозрачность и полезность системы, а также улучшенную способность к творчеству и проблемно-ориентированному мышлению. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенный фреймворк имеет широкий спектр практических приложений. Он может быть использован в областях, таких как дизайн, разработка программного обеспечения, музыкальное творчество и даже в образовании. Он позволяет пользователям более эффективно организовывать идеи, выявлять неявные шаблоны и создавать инновационные решения. Одним из главных преимуществ этого подхода является улучшенная прозрачность и коллаборативность взаимодействия человека с ИИ. Это может привести к более эффективному использованию ИИ в творческих процессах и повысить доступность новых технологий для широкого круга пользователей. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ Исследование Ситонг Ванг показывает, что схемы могут быть эффективным инструментом для поддержки творческого процесса решения задач. Разработанный фреймворк демонстрирует потенциал для улучшения доступности и применения неявных знаний в различных областях. В будущем можно рассмотреть возможность расширения этого фреймворка для включения более сложных доменов и улучшения адаптивности системы к индивидуальным потребностям пользователей. Также важно продолжить исследования в области прозрачности и этики взаимодействия человека с ИИ.

Annotation:

Humans often rely on underlying structural patterns-schemas-to create, whether by writing stories, designing software, or composing music. Schemas help organize ideas and guide exploration, but they are often difficult to discover and apply, especially in complex or unfamiliar domains. My Ph.D. research develops a framework for human-AI schema discovery and application to support creative problem solving. I design systems that support users in sensemaking over examples to abstract schemas, and i...

ID: 2508.05045v1 cs.HC, cs.AI

arXiv PDF

1
2
21
22
23
24

Показано 221 - 230 из 239 записей