📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 C-QUERI: Congressional Questions, Exchanges, and Responses in Institutions Dataset

2025-09-30

Авторы:

Manjari Rudra, Daniel Magleby, Sujoy Sikdar

## Контекст Политические вопросы и ответы в слушаниях и палатных заседаниях не только помогают собирать информацию, но и стратегически используются для продвижения частных интересов, формирования партийных нарративов и влияния на публичное мнение. Однако эти стратегические аспекты в значительной степени остаются неизученными, в основном из-за отсутствия больших данных для изучения подобного дискурса. Слушания в Конгрессе представляют собой идеальный объект для изучения политического вопрошения из-за строгого регулирования процесса, обязательности ответа свидетелей и гарантии вопросов всех политических партий. Это позволяет сравнивать поведение членов Конгресса в разных политических контекстах. C-QUERI (Congressional Questions, Exchanges, and Responses in Institutions Dataset) — это инновационный подход к изучению такого дискурса, объединяя пайплайн для извлечения вопросов-ответов из неструктурированных текстов и построение независимого научного ресурса. ## Метод C-QUERI использует пайплайн, который извлекает вопросы и ответы из неструктурированных текстов слушаний. Этот процесс включает несколько ключевых этапов. Сначала производится предобработка текстов, включая нормализацию, лемматизацию и удаление шума. Затем применяется алгоритм для определения последовательностей вопросов и ответов, который определяет точки начала и конца ответов. В качестве результата получена новая база данных из слушаний Конгресса за период 108-й до 117-й конгрессов. Эта база данных позволяет проводить структурированные анализы вопросов и ответов, сравнивать поведение членов разных политических партий и изучать стратегии вопрошения в политическом дискурсе. ## Результаты Исследования показали, что стратегии вопрошения членов разных политических партий существенно различаются. Например, можно предсказать политическую принадлежность члена Конгресса, проанализировав только его вопросы. Это показывает, что вопросы не только отражают простую информационную потребность, но и стратегически используются для формирования политических отношений. База данных C-QUERI позволяет проводить многочисленные эксперименты, такие как изучение того, как члены разных партий употребляют язык, изменяют свои стратегии в разных контекстах, и влияют на то, как информация подается публике. ## Значимость Результаты C-QUERI могут быть применены в различных областях, включая политическую науку, лингвистику, анализ массовых коммуникаций и анализ поведения в политических интервью. Этот ресурс дает возможность углубить понимание того, как политические вопросы и ответы формируют общественное мнение и

Annotation:

Questions in political interviews and hearings serve strategic purposes beyond information gathering including advancing partisan narratives and shaping public perceptions. However, these strategic aspects remain understudied due to the lack of large-scale datasets for studying such discourse. Congressional hearings provide an especially rich and tractable site for studying political questioning: Interactions are structured by formal rules, witnesses are obliged to respond, and members with diff...

ID: 2509.21548v1 cs.CY, cs.CL

arXiv PDF

📄 Longitudinal and Multimodal Recording System to Capture Real-World Patient-Clinician Conversations for AI and Encounter Research: Protocol

2025-09-24

Авторы:

Misk Al Zahidy, Kerly Guevara Maldonado, Luis Vilatuna Andrango, Ana Cristina Proano, Ana Gabriela Claros, Maria Lizarazo Jimenez, David Toro-Tobon, Oscar J. Ponce-Ponce, Juan P. Brito

#### Контекст В последние годы наблюдается стремительный рост интереса к применению искусственного интеллекта (AI) в медицине. Однако для эффективного применения AI необходимо обучать модели на реальных данных, отражающих взаимодействия между пациентами и клиниками. Несмотря на то, что электронные медицинские рекорды (EHR) содержат биологические данные и меры здоровья, они редко хранят информацию об интеракциях между пациентами и клиниками. Эти взаимодействия, центральные для качественного здравоохранения, происходят в формате голосовых и текстовых обменов, а также видеосигналах. Их отсутствие в обучающих данных может приводить к созданию моделей AI, ограниченных биомедицинским подходом и не учитывающих живые взаимоотношения, определяющие клинические приемы. Целью данного исследования является разработка методологии для построения многомерных данных, которые бы отражали эти взаимодействия, обеспечивая более полное понимание клинических процессов. #### Метод Для достижения этой цели разработана мультимодальная система, которая записывает клинические встречи с использованием 360-градусной видео- и аудиозаписи. Эта система позволяет соединять записи с результатами опросов, проводимых у пациентов после каждого визита, которые оценивают такие аспекты, как эмпатия, удовлетворенность, темп взаимодействия и нагрузка от лечения. Также из EHR извлекаются демографические и клинические данные. Методология включает в себя три главных этапа: 1) регистрация встреч с помощью технологий видео- и аудиозаписи; 2) сбор опросных данных у пациентов; 3) синхронизация и анализ данных в разных модальностях. Исследование проводится в одном академическом клиническом заведении, где принимают участие клиники-специалисты. Для оценки эффективности использованы пять основных критериев: успешность подготовки клиников и пациентов, успешность записи, заполнение опросов и связь модальностей данных. #### Результаты По данным авторов, по месяцам июля-августа 2025 года был принят согласие 35 из 36 клиников (97%) и 212 человек из 281 подходящих пациентов (75%). Из записанных встреч было получено 162 полных наборов данных, а 204 пациента (96%) заполнили опрос. Это указывает на высокую эффективность сбора данных и их конвертацию в многомодальные ресурсы. Также был продемонстрирован успех в синхронизации записей видео, аудио, опросов и EHR, что позволило построить целостный набор данных для исследований. #### Значимость Предлагаемая система может быть применена в различных областях, включая обучение AI-систем

Annotation:

The promise of AI in medicine depends on learning from data that reflect what matters to patients and clinicians. Most existing models are trained on electronic health records (EHRs), which capture biological measures but rarely patient-clinician interactions. These relationships, central to care, unfold across voice, text, and video, yet remain absent from datasets. As a result, AI systems trained solely on EHRs risk perpetuating a narrow biomedical view of medicine and overlooking the lived ex...

ID: 2509.16378v1 cs.CY, cs.CL

arXiv PDF

📄 CogniAlign: Survivability-Grounded Multi-Agent Moral Reasoning for Safe and Transparent AI

2025-09-19

Авторы:

Hasin Jawad Ali, Ilhamul Azam, Ajwad Abrar, Md. Kamrul Hasan, Hasan Mahmud

## Контекст В современном мире развитие искусственного интеллекта (ИИ) стало одной из ключевых областей научных исследований. Однако существуют значительные проблемы в систематизации и моральной нормативности ИИ. Одна из основных проблем заключается в том, что человеческие ценности и моральные принципы часто неясны и конфликтуют друг с другом. Это приводит к сложностям в аккуратном внедрении значимости и морали в AI. Другая проблема — непрозрачность и непонятность многих существующих подходов к ИИ. Эти проблемы могут привести к нежелательным последствиям, таким как неучтенные моральные конфликты и нежелательные побочные эффекты. Из-за этого возникает необходимость в разработке более универсальных и прозрачных систем, которые могут более эффективно и транспарентно учитывать моральные принципы. ## Метод CogniAlign представляет собой многоагентную систему, основанную на принципах натуралистической моральной реальности. Основной принцип этой модели — **survivability**, который определяется как индивидуальное и коллективное выживание. Этот подход включает в себя структурированные делиберации, в которых агенты, представляющие различные научные дисциплины (например, нейробиологию, психологию, социологию и эволюционную биологию), обмениваются аргументами и критикой. Эти аргументы обрабатываются арбитром, который синтезирует их в прозрачные и научно обоснованные решения. Эта модель использует многоуровневую конструктивную архитектуру, где каждый агент обладает специализированным знанием в своей области. Такой подход позволяет глубоко и аналитически рассматривать моральные вопросы, учитывая различные аспекты человеческой природы и социальных систем. ## Результаты Для оценки эффективности CogniAlign проведены ряд экспериментов, включающих обработку классических и новых моральных вопросов. Данные для этих экспериментов были получены из различных источников, включая научные статьи, этические диалоги и сценарии морально-этического противоречия. Результаты показали, что CogniAlign существенно превосходит GPT-4o по нескольким критериям: **аналитической точности** (+16.2%), **широтой рассмотрения вопросов** (+14.3%) и **глубине объяснения** (+28.4%). Например, в Heinz Dilemma, CogniAlign показал результат 89.2, в то время как GPT-4o — 69.2, что свидетельствует о значительной превосходстве в обработке сложных моральных ситуаций. Этот подход демонстрирует значительные позитивные изменения в обработке моральных вопросов, уменьшая неопределенность и моральные конфликты. ## Значимость CogniAlign может применяться в различных сферах

Annotation:

The challenge of aligning artificial intelligence (AI) with human values persists due to the abstract and often conflicting nature of moral principles and the opacity of existing approaches. This paper introduces CogniAlign, a multi-agent deliberation framework based on naturalistic moral realism, that grounds moral reasoning in survivability, defined across individual and collective dimensions, and operationalizes it through structured deliberations among discipline-specific scientist agents. E...

ID: 2509.13356v1 cs.CY, cs.CL

arXiv PDF

📄 An AI-Powered Framework for Analyzing Collective Idea Evolution in Deliberative Assemblies

2025-09-19

Авторы:

Elinor Poole-Dayan, Deb Roy, Jad Kabbara

## Контекст В условиях роста общественного разделения, политической поляризации и уменьшения доверия к институтам, представительные делегатские собрания возникают как перспективный демократический форум для разработки эффективных политических решений на общественно-важных вопросах. Несмотря на теоретический интерес, ограниченное эмпирическое исследование призвано ответить на вопросы о том, как конкретные идеи созревают, решаются или отклоняются в процессе делегатских дискуссий, и о том, как делегатский процесс влияет на персональные взгляды участников и динамику голосования. Этот подход имеет решающее значение для понимания, как интеллектуальные тренды возникают и развиваются в таких коллективных процессах. ## Метод Мы предлагаем искусственно-интеллектуальный фреймворк, основанный на транскриптах взаимодействия отдельных делегатов в технологически подкрепленном, прежде всего встречном, собрании. Методология включает использование транскриптов сборов, разработку технологических приемов, которые позволяют идентифицировать и отобразить все высказываемые идеи и их взаимосвязи, а также моделировать персональные перспективы делегатов и взаимодействия в процессе собрания. Технические решения включают предобработку текстов, использование генеративных моделей текста на базе языковых моделей (LLM) для идентификации индивидуальных идей и связей между ними. Мы также разработали визуализационные методы для построения пространств высказываемых предложений и динамики внесения предложений в рамках конкретных дискуссий. ## Результаты Использовав данные от основного применения, мы исследовали взаимосвязь между конкретными идеями, раскрыв механизмы, способствующие их развитию и включению в рекомендации. Мы также визуализировали траектории и изменения взглядов участников, что дало возможность понять, как определенные доклады или дискуссии влияют на голосование. Наши результаты продемонстрировали, что некоторые идеи получают согласие большей части участников, в то время как другие, несмотря на начальный успех, отводятся в сторону или отвергаются. Методы, примененные в нашей исследовательской работе, позволяют получать высокорезольвентные данные о динамике в развитии коллективных решений, которые не видны в обычных анализах. ## Значимость Полученные результаты могут быть применены в различных областях, включая управление рисками, политическое управление, прогнозирование трендов и моделирование общественной динамики. Этот фреймворк демонстрирует преимущества глубокого обучения в моделировании та

Annotation:

In an era of increasing societal fragmentation, political polarization, and erosion of public trust in institutions, representative deliberative assemblies are emerging as a promising democratic forum for developing effective policy outcomes on complex global issues. Despite theoretical attention, there remains limited empirical work that systematically traces how specific ideas evolve, are prioritized, or are discarded during deliberation to form policy recommendations. Addressing these gaps, t...

ID: 2509.12577v1 cs.CY, cs.CL

arXiv PDF

📄 SESGO: Spanish Evaluation of Stereotypical Generative Outputs

2025-09-05

Авторы:

Melissa Robles, Catalina Bernal, Denniss Raigoso, Mateo Dulce Rubio

## Контекст В последние годы становится очевидным, что большинство оценок биаса в многоязычных моделях генерирующего текста сфокусированы на англоязычных данных, что ограничивает понимание потенциальных вредных эффектов в других языковых и культурных контекстах. Одним из примеров является исследование штейгеровских выводов в моделях на языке испанском, в частности, в контекстах Латинской Америки. Поскольку многоязычные Лучшие Л LLM широко развернуты по всему миру, но оценка их биаса остается центрируется на англоязычной среде, существует опасность, что биасы в других регионах остаются незамеченными. Наша работа открывает новый подход к оценке биаса в испанском языке, особенно в культурно обоснованных контекстах Латинской Америки. ## Метод Для оценки биаса в испанском языке мы предлагаем модульный подход, основанный на подготовленных вопросах, который включает в себя региональные и культурно специфичные выражения и пословицы. Мы используем 4,000+ запросов, охватывающие четыре социальных категории: пол, расовое принадлежность, социоэкономический статус и национальность. Метод BBQ, заключающийся в использовании неявных вопросов, был адаптирован для выявления социальных биаса в испанском языке. Мы также предложили новый метрический подход, который комбинирует точность с направлением ошибки, чтобы лучше представлять модельную производительность и биас в обоих амбигуых и неамбигуых контекстах. ## Результаты Мы провели эксперименты с несколькими моделями, включая State-of-the-Art LLM, и измерили их реакцию на стереотипы. Наши эксперименты показали существенные различия в поведении моделей в зависимости от языка и культурных контекстов. Например, модели показали разные уровни биаса в отношении пола и национальности, что неожиданно включило в себя упоминания о региональных стереотипах. ## Значимость Наша работа имеет значимые потенциальные применения в области создания более культурно чувствительных моделей генерирующего текста. Она также показывает, что техники минимизации биаса, оптимизированные для английского, не эффективны для испанского языка из-за различий в культурных и региональных стереотипах. ## Выводы Наша работа представляет первый систематический подход к оценке биаса в испанском языке в культурно окружающих контекстах. Мы предлагаем новую модель, которая может быть легко расширена для других языков и регионов. Наши результаты показывают наличие социальных биасов в топовых моделях, но такж

Annotation:

This paper addresses the critical gap in evaluating bias in multilingual Large Language Models (LLMs), with a specific focus on Spanish language within culturally-aware Latin American contexts. Despite widespread global deployment, current evaluations remain predominantly US-English-centric, leaving potential harms in other linguistic and cultural contexts largely underexamined. We introduce a novel, culturally-grounded framework for detecting social biases in instruction-tuned LLMs. Our approac...

ID: 2509.03329v1 cs.CY, cs.CL

arXiv PDF

📄 Geopolitical Parallax: Beyond Walter Lippmann Just After Large Language Models

2025-08-29

Авторы:

Mehmet Can Yavuz, Humza Gohar Kabir, Aylin Özkan

#### Контекст Объективность в журналистике всегда была спорной, в зависимости от того, насколько репортажи отражают факты или отражают чувствительность автора. Эта проблема стала еще более актуальной с развитием больших языковых моделей (LLMs), которые, как показывают исследования, могут сформировать или усилить культурные и идеологические предрассудки. В этом исследовании мы рассматриваем "геополитический параллакс" — систематическую разницу в качестве новостей и степени субъективности, сравнивая результаты моделей из Китая и Запада. Мы используем новостные статьи, анализируя их качество и степень субъективности, чтобы выявить потенциальные различия в программных моделях, связанные с геополитическими и культурными факторами. #### Метод Для исследования были использованы статьи из двух разных моделей LLMs: китайского происхождения (Qwen, BGE, Jina) и западного (Snowflake, Granite). Мы применяли модели к бенчмарку новостных статей, оценивая качество статей по 15 различным аспектам, включая стиль, информативность и эмоциональный цвет. Для объективности мы также проанализировали новости, относящиеся к политическим темам, таким как конфликт в Палестине и отношения любых двух стран — Китай и США. Для получения прогнозов мы использовали логистическую регрессию и методы соответствия тем, чтобы сравнить результаты двух моделей. #### Результаты Наши результаты показали систематические различия в оценке качества новостей между моделями разных происхождений. Например, западные модели оценивали статьи о Палестине как более субъективные и с отрицательным эмоциональным цветом. В то же время, китайские модели давали высокие оценки для новизны и детализации, но хуже оценивали техническую ясность. Эти различия были видны не только в локальных новостных темах, но и в международных отношениях, где китайские модели ставили низкие оценки за счет сложности, концентрации или позитивного эмоционального цвета, в то время как западные модели давали высокие оценки. #### Значимость Результаты этого исследования имеют большое значение для широких приложений в области новостей и медиа. Они показывают, что результаты моделей LLM могут отражать геополитические предрассудки, что может привести к ошибочным выводам о качестве новостей. Эти различия могут быть использованы для улучшения медиа-инструментов, чтобы избегать необоснованных оценок качества, влияющих на репутацию стран и новостных агентств. #### Выводы Мы заключаем, что необходимо развитие культурного калибрования LLM-моделей, чтобы избежать смешивания

Annotation:

Objectivity in journalism has long been contested, oscillating between ideals of neutral, fact-based reporting and the inevitability of subjective framing. With the advent of large language models (LLMs), these tensions are now mediated by algorithmic systems whose training data and design choices may themselves embed cultural or ideological biases. This study investigates geopolitical parallax-systematic divergence in news quality and subjectivity assessments-by comparing article-level embeddin...

ID: 2508.19492v1 cs.CY, cs.CL

arXiv PDF

Показано 11 - 16 из 16 записей