📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Tu crois que c'est vrai ? Diversite des regimes d'enonciation face aux fake news et mecanismes d'autoregulation conversationnelle

2025-11-25

Авторы:

Manon Berriche

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This thesis addresses two paradoxes: (1) why empirical studies find that fake news represent only a small share of the information consulted and shared on social media despite the absence of editorial control or journalistic norms, and (2) how political polarization has intensified even though users do not appear especially receptive to fake news. To investigate these issues, two complementary studies were carried out on Twitter and Facebook, combining quantitative analyses of digital traces wit...

ID: 2511.18369v1 cs.CL, cs.CY, cs.HC, cs.MM

arXiv PDF

📄 How AI Fails: An Interactive Pedagogical Tool for Demonstrating Dialectal Bias in Automated Toxicity Models

2025-11-15

Авторы:

Subhojit Ghimire

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Now that AI-driven moderation has become pervasive in everyday life, we often hear claims that "the AI is biased". While this is often said jokingly, the light-hearted remark reflects a deeper concern. How can we be certain that an online post flagged as "inappropriate" was not simply the victim of a biased algorithm? This paper investigates this problem using a dual approach. First, I conduct a quantitative benchmark of a widely used toxicity model (unitary/toxic-bert) to measure performance di...

ID: 2511.06676v1 cs.CL, cs.CY, cs.HC

arXiv PDF

📄 When Can We Trust LLMs in Mental Health? Large-Scale Benchmarks for Reliable LLM Evaluation

2025-10-24

Авторы:

Abeer Badawi, Elahe Rahimi, Md Tahmid Rahman Laskar, Sheri Grach, Lindsay Bertrand, Lames Danok, Jimmy Huang, Frank Rudzicz, Elham Dolatabadi

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Evaluating Large Language Models (LLMs) for mental health support is challenging due to the emotionally and cognitively complex nature of therapeutic dialogue. Existing benchmarks are limited in scale, reliability, often relying on synthetic or social media data, and lack frameworks to assess when automated judges can be trusted. To address the need for large-scale dialogue datasets and judge reliability assessment, we introduce two benchmarks that provide a framework for generation and evaluati...

ID: 2510.19032v1 cs.CL, cs.CY, cs.HC

arXiv PDF

📄 Detecting Early and Implicit Suicidal Ideation via Longitudinal and Information Environment Signals on Social Media

2025-10-18

Авторы:

Soorya Ram Shimgekar, Ruining Zhao, Agam Goyal, Violeta J. Rodriguez, Paul A. Bloom, Hari Sundaram, Koustuv Saha

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

On social media, many individuals experiencing suicidal ideation (SI) do not disclose their distress explicitly. Instead, signs may surface indirectly through everyday posts or peer interactions. Detecting such implicit signals early is critical but remains challenging. We frame early and implicit SI as a forward-looking prediction task and develop a computational framework that models a user's information environment, consisting of both their longitudinal posting histories as well as the discou...

ID: 2510.14889v1 cs.SI, cs.AI, cs.CL, cs.CY, cs.HC

arXiv PDF

📄 Designing LLMs for cultural sensitivity: Evidence from English-Japanese translation

2025-09-17

Авторы:

Helene Tenzer, Oumnia Abidi, Stefan Feuerriegel

**Резюме** В статье рассматривается проблема того, насколько хорошо текущие модели языковых моделей (LLMs) подходят для культурно чувствительной коммуникации, в частности, при переводе рабочих электронных писем с английского на японский. Несмотря на то, что LLMs способны генерировать близкие к идеалу транскрипции слов, остается неясным, насколько эффективно они поддерживают культурно верную коммуникацию. Авторы выполнили эксперимент с использованием различных стилей вывода (традиционный "просто перевести", указание культуры получателя, инструктивные стили с оговорками о нормах японского общения) и проанализировали влияние этих подходов на культурную адекватность трансляции. Основной методом исследования была смешанная модель. Результаты показали, что использование конкретных подсказок для настройки на культуру может значительно улучшить культурную соответствие трансляции. На основе этих выводов авторы дают рекомендации для разработки культурно инклюзивных LLMs, которые могут быть эффективными в многоязычных контекстах.

Annotation:

Large language models (LLMs) are increasingly used in everyday communication, including multilingual interactions across different cultural contexts. While LLMs can now generate near-perfect literal translations, it remains unclear whether LLMs support culturally appropriate communication. In this paper, we analyze the cultural sensitivity of different LLM designs when applied to English-Japanese translations of workplace e-mails. Here, we vary the prompting strategies: (1) naive "just translate...

ID: 2509.11921v1 cs.CL, cs.CY, cs.HC

arXiv PDF

📄 Personality-Enhanced Social Recommendations in SAMI: Exploring the Role of Personality Detection in Matchmaking

2025-09-13

Авторы:

Brittany Harbison, Samuel Taubman, Travis Taylor, Ashok. K. Goel

## Контекст В современном образовательном пространстве, вопросы социальных связей и их влияния на обучение приобретают все большую важность. Участие в социальных группах способствует мотивации, более глубокому пониманию материала и развитию коммуникативных навыков. Однако в онлайн-образовательных платформах сложности с формированием таких групп связаны с отсутствием природных взаимодействий, которые естественно возникают в физических классах. SAMI (Socially Aware Matchmaking Interface) предлагается как решение этой проблемы. Она использует алгоритмы матчмейкинга для создания социальных групп на основе интересов и учебных целей. Однако SAMI стремится к созданию ментальной модели учащихся, но лишь частично учитывает их личностные особенности. Наличие личностной характеристики может сказаться на качестве совпадений и эффективности социальных рекомендаций. Это исследование призвано исследовать этот аспект. ## Метод Мы предлагаем модель детектирования личности, основанную на технологии нулевого выстрела GPT. Модель использует тексты вступительных сообщений учащихся, обычно написанных в форумах курсов, для определения пяти основных личностных характеристик (Big-Five). Для оценки производительности нашей модели проводились сравнительные эксперименты с использованием существующих моделей, которые также предлагаются в открытом доступе. Эта модель была добавлена в SAMI в качестве компонента, расширяющего ее существующие механизмы подбора социальных пар на основании личностных качеств. Эта интеграция позволяет SAMI делать социальные рекомендации, учитывая личностные особенности, и дает возможность изучить их влияние на эффективность системы. ## Результаты Мы провели исследования с использованием данных об учащихся из нескольких курсов. Модель детектирования личности показала высокую точность в определении Big-Five личностных характеристик, сравниваясь с другими моделями. Интеграция этой модели в SAMI позволила делать социальные рекомендации, учитывая личностные особенности. Эксперименты показали, что учет личности улучшает качество совпадений и может привести к более глубинным социальным взаимодействиям. Однако полное влияние этого подхода на увеличение участия учащихся и качестве совпадений будет требовать дальнейшего исследования. ## Значимость Применение модели детектирования личности в SAMI может оказаться полезным в различных областях образования, где социальная поддержка играет ключевую роль в знакомстве и мотивации учеников. Данный подход может быть использован для создания более точных и эффективных социальных рекомендаций, которые учитывают

Annotation:

Social connection is a vital part of learning, yet online course environments present barriers to the organic formation of social groups. SAMI offers one solution by facilitating student connections, but its effectiveness is constrained by an incomplete Theory of Mind, limiting its ability to create an effective mental model of a student. One facet of this is its inability to intuit personality, which may influence the relevance of its recommendations. To explore this, we propose a personality d...

ID: 2509.09583v1 cs.CL, cs.CY, cs.HC, cs.LG, cs.SI

arXiv PDF

📄 Psychologically Enhanced AI Agents

2025-09-06

Авторы:

Maciej Besta, Shriram Chandran, Robert Gerstenberger, Mathis Lindner, Marcin Chrapek, Sebastian Hermann Martschat, Taraneh Ghandi, Patrick Iff, Hubert Niewiadomski, Piotr Nyczyk, Jürgen Müller, Torsten Hoefler

## Контекст Область исследования, связанная с внедрением психологических признаков в агентов на основе бо LLM (Large Language Models), является важной направленностью в современной искусственной интеллектуальной системе. Одним из основных трудностей является то, что создание эффективных агентов с ясным управлением интерпретируемым поведением часто требует дорогостоящих и сложных методов, таких как файн-тюнинг. Эта проблема становится актуальной в ситуациях, где необходимо гарантировать транспарентность и легкость контроля над поведением AI-агентов. Недостаточная возможность регулировать поведение может привести к непредсказуемости и возможным ситуациям, не соответствующим этичным или практическим требованиям. Мотивацией для разработки этого проекта является желание улучшить эффективность и контролируемость AI-агентов, создавая фреймворк, который позволит легко управлять поведением агентов, придавая им психологические архетипы. ## Метод Методология, используемая в этой работе, основывается на применении теории MBTI (Myers-Briggs Type Indicator) для управления поведением агентов. Метод включает в себя "психологическую окраску" агентов с помощью предложений ввода (prompt engineering), чтобы имитировать определенные психологические типы. Подход включает в себя две основные основные течения психологии: чувственность (cognition) и воaffect (affect). Тест 16Personalities используется для автоматического определения и проверки психологического профиля, чтобы обеспечить постоянство характеристик. Эта методика распространяется на различные психологические фреймворки, включая Big Five, HEXACO или Enneagram. Архитектура заключается в том, чтобы использовать LLM-агентов, как объект взаимодействия, применяя структурированные протоколы взаимодействия, включая рефлексию до взаимодействия для улучшения разума и качества решений. ## Результаты Эксперименты проводились на различных задачах, включая генерацию текстов, разбор стратегий в играх и работу в сетях кооперативных агентов. Агенты, окрашенные в психологические типы, показали консистентность в поведении и улучшенную интерпретируемость, например, текстовые генераторы, оптимизированные для эмоциональных вкладов, показали сильное отличие в повествовательных задачах. Аналитически ориентированные агенты достигли лучших результатов в стратегических играх. Также показано, что саморефлексия перед взаимодействием улучшает качество сотрудничества и рациональность решений. Эксперименты подтвердили, что протоколы саморефлексии могут повысить качество решений и сотрудничества в различных контекстах. ## Значимость Раз

Annotation:

We introduce MBTI-in-Thoughts, a framework for enhancing the effectiveness of Large Language Model (LLM) agents through psychologically grounded personality conditioning. Drawing on the Myers-Briggs Type Indicator (MBTI), our method primes agents with distinct personality archetypes via prompt engineering, enabling control over behavior along two foundational axes of human psychology, cognition and affect. We show that such personality priming yields consistent, interpretable behavioral biases a...

ID: 2509.04343v1 cs.AI, cs.CL, cs.CY, cs.HC, cs.MA

arXiv PDF

📄 Oyster-I: Beyond Refusal -- Constructive Safety Alignment for Responsible Language Models

2025-09-05

Авторы:

Ranjie Duan, Jiexi Liu, Xiaojun Jia, Shiji Zhao, Ruoxi Cheng, Fengxiang Wang, Cheng Wei, Yong Xie, Chang Liu, Defeng Li, Yinpeng Dong, Yichi Zhang, Yuefeng Chen, Chongwen Wang, Xingjun Ma, Xingxing Wei, Yang Liu, Hang Su, Jun Zhu, Xinfeng Li, Yitong Sun, Jie Zhang, Jinzhao Hu, Sha Xu, Yitong Yang, Jialing Tao, Hui Xue

## Контекст В последние годы большие языковые модели (LLMs) становятся все более популярными в различных сферах применения, от поиска информации до помощи в решении кастомных задач. Однако при таком росте популярности возникают новые задачи, связанные с рисками, которые могут возникнуть при использовании таких моделей. Наиболее значимыми рисками являются возможность генерирования вредоносного контента и влияние на поведение пользователей, особенно в ситуациях, когда они находятся под психологическим давлением. Классические подходы к обеспечению безопасности в LLMs направлены на профилактику вредоносного воздействия, основываясь на предотвращении атак злоумышленников. Однако менее внимания уделяется ситуациям, когда пользователи, находящиеся в психологическом стрессе, могут искать помощь на неблагонамеренных платформах, которые могут не способствовать их благополучию. В таких ситуациях ответ модели может сильно повлиять на последующие действия пользователя. Стандартные "защитные отказы" могут привести к тому, что пользователь повторит запрос или перейдет на менее безопасные платформы. Чтобы сделать модели безопасными не только для защиты от атак, но и для помощи пользователям, необходимо развить новый подход, который бы строил безопасную и доверительную связь между моделью и пользователем. Такой подход должен быть уместен в реальных условиях, когда пользователи могут искать помощь в трудных жизненных ситуациях. ## Метод Методология, описанная в статье, называется Constructive Safety Alignment (CSA). Это подход, который предлагает переключиться с "защитного отказа" на "построение доверия" в отношениях модели с пользователем. Основные компоненты CSA - это: 1. **Game-theoretic anticipation of user reactions** - модель предсказывает возможные реакции пользователя на свои ответы и адаптирует свой подход в зависимости от этого. 2. **Fine-grained risk boundary discovery** - модель определяет тонкие границы риска, что позволяет отличать неблагонамеренные запросы от тех, которые требуют помощи. 3. **Interpretable reasoning control** - модель объясняет свои решения и позволяет пользователю понять, почему она выбрала конкретный подход. CSA не только предотвращает вредоносное использование моделей, но и активно помогает пользователям, находящимся в психологическом стрессе, предоставляя им ценные рекомендации и пути к решению проблем. Такой подход включен в модель Oyster-I (Oy1), которая применяет эти принципы для достижения более доверительных и полезных отношений с пользователем. ## Результаты В ходе исследования был проведен ряд экспериментов, которые позволили оценить эффективность метода Constructive Safety Alignment. Результаты показали, что Oyster-I (Oy1) демонстрирует вы

Annotation:

Large language models (LLMs) typically deploy safety mechanisms to prevent harmful content generation. Most current approaches focus narrowly on risks posed by malicious actors, often framing risks as adversarial events and relying on defensive refusals. However, in real-world settings, risks also come from non-malicious users seeking help while under psychological distress (e.g., self-harm intentions). In such cases, the model's response can strongly influence the user's next actions. Simple re...

ID: 2509.01909v2 cs.AI, cs.CL, cs.CY, cs.HC, cs.SC

arXiv PDF

📄 When Algorithms Meet Artists: Topic Modeling the AI-Art Debate, 2013-2025

2025-08-09

Авторы:

Ariya Mukherjee-Gandhi, Oliver Muellerklein

**Резюме** Проблема: Генерирующиеся с помощью AI технологии изменяют творческую сферу, но часто игнорируются взгляды художников в общественном и научном дискурсе. Это отклонение может привести к необоснованному техническому гейткипингу и ущемлению участия художников в формировании будущих тенденций. Решение: Авторы провели 12-летний анализ (2013–2025 гг.) англоязычного дискурса о генерируемом AI искусстве, основываясь на 439 выборках из статей, блогов, правовых документов и других источников. Используя методологию BERTopic, они выделили пять устойчивых тематических кластеров и проанализировали между собой взаимосвязи между темами и практическими аспектами жизни художников. Основные выводы: Авторы выявили несоответствие между перспективами художников и представлением их вопросов в общественной сфере. Они подчеркнули необходимость включения творческого сообщества в дискуссии и выделили технический гейткипинг в качестве проблемы. Работа предлагает новый подход к изучению дискурса о AI-сфере искусства, призывая к более транспарентным и инклюзивным дискуссиям.

Annotation:

As generative AI continues to reshape artistic production and alternate modes of human expression, artists whose livelihoods are most directly affected have raised urgent concerns about consent, transparency, and the future of creative labor. However, the voices of artists are often marginalized in dominant public and scholarly discourse. This study presents a twelve-year analysis, from 2013 to 2025, of English-language discourse surrounding AI-generated art. It draws from 439 curated 500-word e...

ID: 2508.03037v1 cs.CL, cs.CY, cs.HC

arXiv PDF