📚 Саммари научных статей из arXiv

Найдено 239 результатов по запросу 'cs.HC, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 fCrit: A Visual Explanation System for Furniture Design Creative Support

2025-08-19

Авторы:

Vuong Nguyen, Gabriel Vigliensoni

## Контекст Фурнитурное дизайнерство является сложной и творческой дисциплиной, требующей тщательного рассмотрения формы, функциональности и эстетики. Существуют проблемы в понимании и оценке творческих решений, особенно в сфере мебели, где требуется индивидуальный подход к каждому проекту. Одной из основных проблем является отсутствие систем, предоставляющих достаточно подробные и понятные объяснения своих решений. Эта недостаточность может затруднять процесс творческого поиска и решения проблем. Мотивацией для создания fCrit является необходимость создать систему, которая не только критикует дизайн, но и объясняет свои решения научно обоснованным и понятным для пользователя языком, соответствующим их стилю мышления и творческим интересам. ## Метод fCrit основывается на диалоговой системе, взаимодействующей с пользователем для критики дизайна мебели. Методология основывается на обучении с подкреплением, где система изучает ошибки и позитивные примеры в ходе общения. Архитектура sCrit включает в себя несколько агентов, каждый из которых специализируется на конкретной области дизайна, такой как форма, функциональность или эстетика. Система использует структурированную базу знаний о дизайне мебели, которая позволяет агентам формировать точные и значимые объяснения. Данные для обучения были подготовлены с использованием реальных проектов дизайна мебели и экспертных оценок. ## Результаты В ходе экспериментов было продемонстрировано, что fCrit в сравнении с конкурентными системами демонстрирует высокую точность в критике дизайна и понятность в своих объяснениях. Были проведены тесты с участием профессиональных дизайнеров, которые оценили возможность системы адаптировать свои рекомендации к разным стилям и предпочтениям пользователей. Результаты показали, что fCrit может адекватно рассматривать не только технические аспекты дизайна, но и творческие подходы, способствуя творческому развитию пользователя. ## Значимость fCrit может быть применена в широком кругу областей, включая творческое дизайнерство, обучение дизайну и помощь дизайнерам в решении коммуникативных проблем. Одним из основных преимуществ является возможность персонализированного подхода к каждому пользователю, так как система адаптирует свои объяснения к их стилю и требованиям. Это может улучшить качество работы дизайнеров и расширить их творческий потенциал. Кроме того, fCrit может стать полезным инструментом для учащихся в области дизайна, помогая им понять и применять знания в реальности. ## Выводы fCrit достигает значительного прогресс

Annotation:

We introduce fCrit, a dialogue-based AI system designed to critique furniture design with a focus on explainability. Grounded in reflective learning and formal analysis, fCrit employs a multi-agent architecture informed by a structured design knowledge base. We argue that explainability in the arts should not only make AI reasoning transparent but also adapt to the ways users think and talk about their designs. We demonstrate how fCrit supports this process by tailoring explanations to users' de...

ID: 2508.12416v1 cs.HC, cs.AI, H.5.2

arXiv PDF

📄 AI That Helps Us Help Each Other: A Proactive System for Scaffolding Mentor-Novice Collaboration in Entrepreneurship Coaching

2025-08-19

Авторы:

Evey Jiaxin Huang, Matthew Easterday, Elizabeth Gerber

## Контекст Предпринимательство характеризуется задачами, ограниченными неопределенностью и сложностью. Новички часто сталкиваются с трудностями в оценке рисков, выявлении недостатков в своих предположениях и принятии стратегических решений в условиях неопределенности. Это приводит к неэффективности и неуверенности в действиях. Менторам, в свою очередь, приходится сталкиваться с ограниченным временем и ограниченной видимостью, что препятствует предоставлению целевой поддержки. Для улучшения этого процесса было предложено создание проактивной системы поддержки, объединяющей модель логики предпринимательского риска и большой языковой модель (LLM), чтобы помочь как новичкам, так и менторам в организации более эффективных и индивидуальных встреч. ## Метод Система основывается на моделировании предпринимательского риска и использовании технологий LLM для прогнозирования и анализа. Она активно способствует повышению метакогнитивных навыков у новичков, помогая им сформировать более структурированное мышление. Более того, система помогает менторам оптимизировать свои подходы к консультациям и планировать встречи с целенаправленностью и эмоциональным внимательностью. Важной особенностью является возможность менторов редактировать модель, что позволяет адаптировать ее к постоянно меняющимся их потребностям. В ходе испытаний на реальных пользователях были выявлены основные проблемы, такие как вопросы доверия, неточность диагноза и ожидания от AI. ## Результаты Проведенные эксперименты показали, что использование системы улучшило метакогнитивные навыки новичков, помогло менторам разработать более эмоционально вовлекающие стратегии и улучшило глубину, намеренность и фокусировку встреч. Тем не менее, были выяснены некоторые проблемы, такие как вопросы доверия к системе, возможность неточного диагноза и несоответствие ожиданий от системы. Эти проблемы были адресованы в рамках исследования, чтобы оптимизировать работу системы и улучшить ее эффективность. ## Значимость Система может быть применена в различных сферах, таких как здравоохранение, образование и профессиональные консультации. Она предоставляет новые возможности для проактивной поддержки в сложных, неопределенных областях. Ее преимущества заключаются в увеличении эффективности взаимодействия менторов и новичков, повышении качества решений и просвещения. Однако, стоит отметить, что для достижения максимального эффекта необходимо проработать вопросы доверия к системе и улучшить процесс диагноза. Будущие исследования будут сконцентрированы на ра

Annotation:

Entrepreneurship requires navigating open-ended, ill-defined problems: identifying risks, challenging assumptions, and making strategic decisions under deep uncertainty. Novice founders often struggle with these metacognitive demands, while mentors face limited time and visibility to provide tailored support. We present a human-AI coaching system that combines a domain-specific cognitive model of entrepreneurial risk with a large language model (LLM) to proactively scaffold both novice and mento...

ID: 2508.11052v1 cs.HC, cs.AI, 68T35 (Primary), 68U99 (Secondary), H.5.2

arXiv PDF

📄 Is General-Purpose AI Reasoning Sensitive to Data-Induced Cognitive Biases? Dynamic Benchmarking on Typical Software Engineering Dilemmas

2025-08-19

Авторы:

Francesco Sovrano, Gabriele Dominici, Rita Sevastjanova, Alessandra Stramiglio, Alberto Bacchelli

#### Контекст Область исследования — обнаружение и изучение возможности возникновения когнитивных биаз в общеприменных искусственных интеллектах (GPAI) в контексте программного обеспечения. Мотивация заключается в том, что человеческие когнитивные биаз могут привести к серьёзным ошибкам в программном обеспечении, а GPAI, как нечеловеческий актор, может способствовать их устранению. Однако тренировка GPAI на людских данных приводит к возможности возникновения имитации человеческих структур мышления, в том числе и биаз. Таким образом, возникает вопрос: являются ли GPAI системы сами подвержены когнитивным биазум и, если да, то в какой степени? Данная работа стремится оценить эту проблему в сфере программного обеспечения. #### Метод Для изучения этой проблемы был разработан динамический фреймворк, ориентированный на оценку уязвимости GPAI к когнитивным биазум в контексте реальных дилемм программного обеспечения. Основной эксперимент начинался с семинарного набора 16 ручной работы, каждая из которых содержала один из 8 разных биаз (например, привязка, фрейминг) и соответствующих неизбилих вариантов. Для увеличения масштаба была разработана методика генерации новых задач, основывающаяся на GPAI-системах. Эта методика позволяла сохранять биаз-индуцирующие лексические сигналы, в то же время изменяя лишь поверхностные детали задач. Для проверки того, что новые задачи сохраняют биаз, использовались методы проверки логики (Prolog) и валидации с помощью LLM-системы. Это позволило гарантировать, что биаз являются вредными и невосприимчивыми для безуклонного логического анализа. #### Результаты В результате было протестировано несколько ведущих GPAI-систем (GPT, LLaMA, DeepSeek). На ранних этапах оказалось, что все протестированные системы подвержены когнитивным биазум, возникающим из-за учёта лексических сигналов, не относящихся к логике задачи. Это привело к некорректным выводам, особенно при простых задачах, где часто использовались глубинные выводы. Однако с увеличением сложности задач системы становились все более чувствительными к биазум (до 49%), что указывает на существенный риск в реальных производственных условиях. #### Значимость Полученные результаты имеют применимость в разных областях, где GPAI используется для автоматизации решений или помощи в программной деятельности. Они показывают, что GPAI может представлять собой не только инструмент для устранения биаз, но и источник новых биаз, которые могут иметь влияние на решения. Изучение этой проблемы может привести к более безопасному и эффективно

Annotation:

Human cognitive biases in software engineering can lead to costly errors. While general-purpose AI (GPAI) systems may help mitigate these biases due to their non-human nature, their training on human-generated data raises a critical question: Do GPAI systems themselves exhibit cognitive biases? To investigate this, we present the first dynamic benchmarking framework to evaluate data-induced cognitive biases in GPAI within software engineering workflows. Starting with a seed set of 16 hand-craf...

ID: 2508.11278v1 cs.HC, cs.AI, cs.SE

arXiv PDF

📄 Trustworthy AI Psychotherapy: Multi-Agent LLM Workflow for Counseling and Explainable Mental Disorder Diagnosis

2025-08-19

Авторы:

Mithat Can Ozgun, Jiahuan Pei, Koen Hindriks, Lucia Donatelli, Qingzhi Liu, Xin Sun, Junxiao Wang

## Контекст Область исследования сосредоточена на развитии умных систем, которые могут обеспечивать надежное и эффективное сопровождение в области психотерапии и диагностики психических расстройств. Существуют значительные проблемы, такие как недостаточность прозрачности в диагностике, нехватка профессионального медицинского опыта в системах машинного обучения и сложность в изготовлении данных для тренировки медицинских моделей. Эти проблемы затрудняют достижение должного уровня доверия и точности в системах, предназначенных для помощи в психологическом здравоохранении. Естественной мотивацией является создание систем, которые не только обеспечат высокую точность в диагностике, но и обеспечат транспарентные и обоснованные результаты, чтобы повысить доверие к использованию таких технологий в практических медицинских задачах. ## Метод Методология основывается на использовании технологии бо LLM-агентов, которые могут имитировать профессиональные диалоги между психотерапевтом и клиентом. Для достижения целей используется имитация реальных ситуаций, в которых решаются проблемы, связанные с диагностикой и психотерапевтическим сопровождением. Для обеспечения полноты и ясности результатов разработана система "DSM5AgentFlow", которая способна синтезировать и анализировать DSM-5-уровня диагностических вопросов, а также делать транспарентные пошаговые оценки диагноза. Архитектура системы состоит из нескольких агентов, которые обеспечивают интерактивность и логику диалога, а также использование высокоточных технологий для получения диагностических данных. ## Результаты Набор экспериментов проводился с использованием различных LLM-моделей, включая специализированные модели для диагностики. Эти модели были оценены на таких критериях, как конверсационная реальность, точность диагноза и понятность выводов. Особое внимание было уделено сравнению с другими существующими моделями, что позволило показать высокую эффективность DSM5AgentFlow в выдаче обоснованных и прозрачных результатов диагностики. Также были проведены опыты на конкретных клиентских профилях, что позволило показать шаг за шагом получение диагностических выводов, которые могут быть понятны как для клиентов, так и для клинических специалистов. ## Значимость Разработанное решение имеет широкие применения в отраслях медицины, здравоохранения и психотерапии. Оно обеспечивает высокую точность диагностики, упрощает процесс понимания результатов для медиков и клиентов. Особенно важное преимущество заключается в поддержке прозрачности решений, что улучшает доверие к с

Annotation:

LLM-based agents have emerged as transformative tools capable of executing complex tasks through iterative planning and action, achieving significant advancements in understanding and addressing user needs. Yet, their effectiveness remains limited in specialized domains such as mental health diagnosis, where they underperform compared to general applications. Current approaches to integrating diagnostic capabilities into LLMs rely on scarce, highly sensitive mental health datasets, which are cha...

ID: 2508.11398v1 cs.HC, cs.AI, cs.IR

arXiv PDF

📄 Facilitating Longitudinal Interaction Studies of AI Systems

2025-08-16

Авторы:

Tao Long, Sitong Wang, Émilie Fabre, Tony Wang, Anup Sathya, Jason Wu, Savvas Petridis, Dingzeyu Li, Tuhin Chakrabarty, Yue Jiang, Jingyi Li, Tiffany Tseng, Ken Nakagaki, Qian Yang, Nikolas Martelaro, Jeffrey V. Nickerson, Lydia B. Chilton

## Контекст Универсальные системы пользовательского интерфейса (UIST) широко используются для решения различных задач, включая работу с данными, коммуникацию, игры и творчество. Со временем, пользователи настраивают эти системы, изменяют их функционал, создают новые решения и присваивают им новые значения. Таким образом, системы UIST становятся важной частью повседневного жизнеспособного интеллекта. Однако существуют трудности при оценке и изучении этих систем в динамике, так как одиночные эксперименты не могут полностью отразить их динамическое развитие и адаптацию. Необходимы методы, позволяющие проводить длительные исследования, чтобы лучше понять и улучшить взаимодействие с пользователями в течение продолжительного времени. ## Метод Для решения этих проблем разработаны новые методики, позволяющие проводить длительные исследования, отслеживая изменения поведения систем UIST в реальном времени. Это включает в себя развитие инструментов для сбора данных, анализа и оценки динамических изменений в поведении систем. Методы основываются на учете истории взаимодействия пользователей, анализе изменений в их потребностях и внедрения адаптивных механизмов. Эти инструменты развиваются с учетом потребностей разных групп пользователей и индивидуальных особенностей. ## Результаты На основе разработанной методики проводились эксперименты, в ходе которых был изучен динамический процесс взаимодействия пользователей с UIST. Были оценены различные сценарии применения, включая работу с данными, управление и творческие задачи. Изученные данные позволили выявить тенденции в изменении поведения пользователей, определить факторы, влияющие на эффективность взаимодействия, и разработать рекомендации для улучшения систем. Таким образом, исследования позволили получить новые знания о динамике взаимодействия пользователей с UIST и подготовить основу для дальнейших разработок. ## Значимость Результаты имеют значительное значение для развития UIST в сферах, где необходимо учитывать динамические изменения пользовательского поведения. Это могут быть применения в области управления, здравоохранения, образования и творческих профессий. Плюсы такого подхода заключаются в том, что он позволяет разрабатывать более эффективные и понятные системы, улучшая качество интерфейсов и увеличивая удобство для пользователей. Будущие исследования будут сконцентрированы на дальнейшем изучении динамических систем, а также на продвижении методик для других областей, где взаимодействие с пользователями требует длительного мониторинга и адаптации. ## Выводы Данное исследовани

Annotation:

UIST researchers develop tools to address user challenges. However, user interactions with AI evolve over time through learning, adaptation, and repurposing, making one time evaluations insufficient. Capturing these dynamics requires longer-term studies, but challenges in deployment, evaluation design, and data collection have made such longitudinal research difficult to implement. Our workshop aims to tackle these challenges and prepare researchers with practical strategies for longitudinal stu...

ID: 2508.10252v1 cs.HC, cs.AI, cs.CY

arXiv PDF

📄 MCP2OSC: Parametric Control by Natural Language

2025-08-16

Авторы:

Yuan-Yi Fan

#### Контекст Процессы создания контента в мультимедиа становятся все более интерактивными, но требуют значительных усилий для достижения высокой точности при выполнении комплексных задач. Текстовые запросы позволяют легко задавать потребности, но часто не обеспечивают достаточной точности. Альтернативой — сложные системы управления с помощью нобсов или ползунков, которые требуют большого количества знаний и ресурсов. Это создает затруднения в поиске баланса между простотой и точностью. Целью данного исследования является разработка системы, которая бы способствовала более эффективному сочетанию текстовых запросов и точных настроек, с помощью нового протокола MCP (Model Context Protocol). #### Метод Для решения этой проблемы предлагается использовать новый протокол MCP (Model Context Protocol), который позволяет использовать текстовые запросы для управления OSC (OpenSoundControl) системами. Эта система включает в себя MCP2OSC-сервер и новые критерии для разработки текстовых запросов. Основная методика заключается в комбинировании мощи значительного языкового модели (LLM) с функциональностью сервера для преобразования естественного языка в OSC-сообщения. Использованы 14 практических примеров с запросами и шаблонами текстовых запросов, что позволило проверить эффективность системы в различных сценариях использования. #### Результаты Испытания показали, что Claude (LLM), сконфигурированный с MCP2OSC-сервером, позволяет легко и эффективно управлять OSC-системами с помощью естественного языка. Эта система может искать, валидировать, интерпретировать, дебажить, и визуализировать OSC-сообщения, а также управлять OSC-адресами. Отдельно подчеркнут высокий уровень точности и простоту взаимодействия, которые данная система предоставляет. Эксперименты подтверждают, что MCP2OSC можно использовать для решения ключевых задач в разработке OSC-систем, достигая точности и комфорта. #### Значимость Предлагаемая система может быть применена в различных областях, включая звуковую и визуальную синтез, робототехнику, интерактивные инсталляции, и другие системы, требующие точного управления. Основные преимущества заключаются в упрощении процессов управления, увеличении точности, и возможности комбинирования текстовых запросов с точным техническим контролем. Будущие исследования могут сфокусироваться на расширении функциональности MCP2OSC, внедрении в различные мультимедийные системы, и развитии дополнительных критериев текстовых запросов. #### Выводы Разработанная система MCP2OSC представляет собой новую модель сов

Annotation:

Text prompts enable intuitive content creation but may fall short in achieving high precision for intricate tasks; knob or slider controls offer precise adjustments at the cost of increased complexity. To address the gap between knobs and prompts, a new MCP (Model Context Protocol) server and a unique set of prompt design criteria are presented to enable exploring parametric OSC (OpenSoundControl) control by natural language prompts. Demonstrated by 14 practical QA examples with best practices a...

ID: 2508.10414v1 cs.HC, cs.AI, cs.SD, eess.AS

arXiv PDF

📄 Biased AI improves human decision-making but reduces trust

2025-08-15

Авторы:

Shiyang Lai, Junsol Kim, Nadav Kunievsky, Yujin Potter, James Evans

## Контекст В настоящее время AI-системы стремятся минимизировать риски, придерживаясь идеологической нейтральности. Однако это может привести к автоматизационному биазу, снижая уровень когнитивного взаимодействия человека с технологиями. Данное исследование рассматривает вопрос, может ли политически биазированный AI улучшить решательные способности человека, увеличив его уровень увлечения и уменьшив субъективные ошибки в оценках. На практике, политически биазированный AI может помочь лучше справляться с задачами, но при этом рискует снижать доверие к себе. ## Метод Для проведения исследования были проведены случайные эксперименты с 2500 участниками. Участники взаимодействовали с разными версиями GPT-4, каждая из которых использовала политически биазированные модели. Задачами, которые необходимо было решать, были вопросы оценки информации. Для сравнения были использованы как системы с политически биазированными ассистентами, так и нейтральные. Эксперимент был проведен в разных условиях, в зависимости от того, стремились ли участники преодолеть свои субъективные предрассудки. ## Результаты Участники, взаимодействующие с политически биазированными AI-системами, показали лучшие результаты в решении задач. Эти системы увеличивали уровень увлечения, а также сокращали субъективную ошибку в оценках. Особенно значительные эффекты были замечены при взаимодействии с AI-системами, которые выражали противоположные точки зрения. Однако системы с политически биазированными ассистентами получили меньше доверия в сравнении с нейтральными AI-системами. ## Значимость Результаты этих исследований могут быть применены в различных областях, где важно улучшить решательные способности человека. Например, в сфере политики, где понимание другой точки зрения может помочь в разрешении конфликтов. Также, могут быть применены в области медицины, где важно принимать верные решения, основанные на достоверной информации. Биазированный AI может стать полезным инструментом для повышения качества решений, но риск снижения доверия должен быть строго контролируемым. ## Выводы Основные достижения данного исследования заключаются в том, что политически биазированный AI может улучшить решательные способности человека. Однако этот процесс должен быть строго контролируем, так как существует риск снижения доверия к системе. Будущие исследования должны направляться на разработку стратегий, которые бы позволяли воспользоваться преимуществами биазированных AI-систем, не потеряв доверия к ним.

Annotation:

Current AI systems minimize risk by enforcing ideological neutrality, yet this may introduce automation bias by suppressing cognitive engagement in human decision-making. We conducted randomized trials with 2,500 participants to test whether culturally biased AI enhances human decision-making. Participants interacted with politically diverse GPT-4o variants on information evaluation tasks. Partisan AI assistants enhanced human performance, increased engagement, and reduced evaluative bias compar...

ID: 2508.09297v2 cs.HC, cs.AI, cs.CY

arXiv PDF

📄 Hallucination vs interpretation: rethinking accuracy and precision in AI-assisted data extraction for knowledge synthesis

2025-08-15

Авторы:

Xi Long, Christy Boscardin, Lauren A. Maggio, Joseph A. Costello, Ralph Gonzales, Rasmyah Hammoudeh, Ki Lai, Yoon Soo Park, Brian C. Gin

#### Контекст Информационные технологии становятся важной составляющей в сфере здравоохранения, поддерживая клинические решения и знания. Однако их эффективность зависит от качества данных и точности их интерпретации. Автоматизация процессов сбора и анализа данных с помощью ИИ позволяет ускорить работу, но она не без проблем. Одна из основных проблем — возникновение "халлуцинаций" в искусственном интеллекте, когда система генерирует неверные или неподходящие данные. Данное исследование фокусируется на проблеме различения "халлуцинаций" от интерпретаций человека и на поиске способов повысить точность и эффективность ИИ-помощи в синтезе знаний. #### Метод Для экспериментов использовался ИИ-ориентированный платформа для выполнения синтеза знаний. Авторы исследования оценили работу системы на 187 публикациях с 17 вопросами, полученными из специального специального обзора. Для оценки согласованности ответов сравнивались результаты ИИ и человеческих ответов. Для категориальных вопросов использовалась мера interrater reliability, а для открытых вопросов — тематическая согласованность. Ошибки выявлялись путем сравнения ответов с исходными публикациями. #### Результаты Находилось, что ИИ показывает высокую согласованность с человеческими ответами в тех случаях, когда ответы являются четко определенными и не требуют интерпретации (например, заголовок, цель исследования). Однако при вопросах, требующих субъективного разбора или отсутствующих в исходных данных, согласованность значительно ниже. Практически все ошибки в ответах ИИ были связаны с интерпретационными трудностями (18.3%), в то время как человеческие ошибки происходили намного чаще (4.37%). AI-анализ позволил выявить сложности интерпретации, что позволило улучшить процесс прежде чем передать результаты на человеческий проверку. #### Значимость Естественная синхронность ИИ с человеческими ответами показывает возможность использовать артифициальный интеллект в качестве достоверного и полезного инструмента в знаний синтезе. В то же время, находились значительные отличия во время выявления сложных ситуаций, что подтверждает необходимость человеческого вклада в процесс. Исследование свидетельствует о возможности использования ИИ в процессе знаний синтеза, но также указывает на необходимость осторожности в работе с интерпретируемыми данными. #### Выводы Результаты демонстрируют, что ИИ может стать достоверным и эффективным сопутствующим средством в синтезе знаний, но его работа требует дополнительного анализа и контроля

Annotation:

Knowledge syntheses (literature reviews) are essential to health professions education (HPE), consolidating findings to advance theory and practice. However, they are labor-intensive, especially during data extraction. Artificial Intelligence (AI)-assisted extraction promises efficiency but raises concerns about accuracy, making it critical to distinguish AI 'hallucinations' (fabricated content) from legitimate interpretive differences. We developed an extraction platform using large language mo...

ID: 2508.09458v2 cs.HC, cs.AI, cs.ET

arXiv PDF

📄 How Persuasive Could LLMs Be? A First Study Combining Linguistic-Rhetorical Analysis and User Experiments

2025-08-15

Авторы:

Daniel Raffini, Agnese Macori, Lorenzo Porcaro, Tiziana Catarci, Marco Angelini

## Контекст Общение с искусственным интеллектом (ИИ), особенно с использованием технологий типа Large Language Models (LLMs), становится все более распространенным во всех сферах жизнедеятельности. Одна из ключевых вопросов, которые возникают в этой области, является потенциальная эффективность таких моделей в создании убедительных аргументированных текстов, которые могут влиять на социальную и политическую сферу. Несмотря на то, что LLMs, такие как ChatGPT, показали впечатляющую способность генерировать логично структурированные тексты, их эффективность в области убеждающей речи и политической деятельности еще не полностью оценена. Эта статья стремится заполнить эту нишу, рассматривая языковые и реторические особенности текстов, создаваемых LLMs, и их эффективность в убеждающем воздействии на читателей, особенно в сфере этичных вопросов. ## Метод Для достижения этой цели был проведен эксперимент, в рамках которого 62 участника прошли тесты перед и после взаимодействия с текстами, сгенерированными ChatGPT. Участники прочитали аргументированные тексты на этично-номинированные темы, такие как роль ИИ в образовании и медицине. Затем была проведена лингвистическая и реторическая анализирующая версии текстов, созданных генеративным ИИ. Основные показатели, рассматриваемые в анализе, включали макроструктуру аргументации, частоту использования формулировок, и стилистическую богатство. Эти параметры были измерены для определения того, насколько эффективно ChatGPT генерирует тексты, которые могут способствовать изменению точки зрения участников. ## Результаты Экспериментальные результаты показали, что тексты, сгенерированные ChatGPT, обладают высокой логичностью и согласованной макроструктурой. Однако они отмечаются низкой стилистической разнообразием и частотой использования формулировок. Лингвистический анализ также отмечал, что ChatGPT в силу своих алгоритмов ограничен в способности генерировать тексты, которые могут значительно изменить мнение читателя по этичным вопросам. Несмотря на то, что участники часто отмечали положительные аспекты, выделенные в текстах, их этические опасения не только не значительно уменьшились, но и, в некоторых случаях, усилились после чтения. ## Значимость Находки этого исследования имеют значительное значение для ряда областей. Во-первых, они могут быть применены для улучшения технологий генерирования текстов, особенно в сферах, где этические вопросы играют ключевую роль. Во-вторых, результаты могут быть полезны для разработки методов

Annotation:

This study examines the rhetorical and linguistic features of argumentative texts generated by ChatGPT on ethically nuanced topics and investigates their persuasive impact on human readers.Through a user study involving 62 participants and pre-post interaction surveys, the paper analyzes how exposure to AI-generated arguments affects opinion change and user perception. A linguistic and rhetorical analysis of the generated texts reveals a consistent argumentative macrostructure, reliance on formu...

ID: 2508.09614v1 cs.HC, cs.AI, cs.CL, cs.CY

arXiv PDF

📄 A Close Reading Approach to Gender Narrative Biases in AI-Generated Stories

2025-08-15

Авторы:

Daniel Raffini, Agnese Macori, Marco Angelini, Tiziana Catarci

#### Контекст Гендерные биасы в искусственном интеллекте (ИИ) становятся все более актуальными в связи с ростом популярности технологий, которые становятся частью повседневной жизни. Исследователи подчеркивают, что гендерные предрассудки в текстах, генерируемых ИИ, могут повлиять на создание клише и укрепить существующие стереотипы. Это, в свою очередь, может привести к необоснованным предпочтениям в гендерных ролях и жизненных ситуациях. Однако многие исследования стремятся проанализировать эти проблемы с использованием метрик и статистического анализа, обходясь без подробного контекстуального исследования. В данной статье предлагается новый подход, основанный на "ближайшем чтении" (close reading), который позволяет глубже понять и оценить гендерные биасы в текстах, генерируемых с помощью ИИ. #### Метод Для исследования гендерных биасов использовались раскадровки стихотворных произведений, спроектированные на основе пропов Михаила Проппа (Propp's character classifications) и фрейговской структуры (Freytag’s narrative structure). Эти раскадровки были использованы для создания подробных заданий генерации текстов в ИИ-системах, включая ChatGPT, Gemini и Claude. Тексты были рассмотрены с пристальным вниманием к соответствию заданию, распределению пола среди персонажей, их физическим и психологическим описаниям, действиям и развитию сюжета. Затем проводился сравнительный анализ, чтобы выявить степень выраженности гендерных предрассудков и их влияние на развитие сюжета и отношения между персонажами. #### Результаты Исследование показало, что даже в условиях однозначного задания генерации текста системы ИИ продолжают проявлять гендерные предрассудки, особенно неявные. Например, женские персонажи чаще описываются в физическом контексте, в то время как мужские персонажи — в позиции владельца действия. Также выявлено, что гендерные стереотипы могут оказывать влияние на развитие сюжета, в том числе в отношениях между персонажами. Эти результаты иллюстрируют необходимость подхода, основанного на ближайшем чтении, для выявления и анализа неявных гендерных биасов в текстах ИИ. #### Значимость Предложенный подход к изучению гендерных биасов в текстах ИИ имеет широкие применения в области гуманитарных технологий, включая создание текстов, предназначенных для образовательных или развлекательных целей. Этот подход позволяет выявлять не только явные, но и неявные гендерные предрассудки, что может способствовать созданию более нейтральных текстов. Более того, этот подход может стать началом для развити

Annotation:

The paper explores the study of gender-based narrative biases in stories generated by ChatGPT, Gemini, and Claude. The prompt design draws on Propp's character classifications and Freytag's narrative structure. The stories are analyzed through a close reading approach, with particular attention to adherence to the prompt, gender distribution of characters, physical and psychological descriptions, actions, and finally, plot development and character relationships. The results reveal the persisten...

ID: 2508.09651v1 cs.HC, cs.AI, cs.CL, cs.CY

arXiv PDF

1
2
18
19
20
21
22
23
24

Показано 191 - 200 из 239 записей