📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 AI-Enabled grading with near-domain data for scaling feedback with human-level accuracy

2025-12-05

Авторы:

Shyam Agarwal, Ali Moghimi, Kevin C. Haudek

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Constructed-response questions are crucial to encourage generative processing and test a learner's understanding of core concepts. However, the limited availability of instructor time, large class sizes, and other resource constraints pose significant challenges in providing timely and detailed evaluation, which is crucial for a holistic educational experience. In addition, providing timely and frequent assessments is challenging since manual grading is labor intensive, and automated grading is ...

ID: 2512.04113v1 cs.CY, cs.AI, cs.HC, cs.LG

arXiv PDF

📄 See, Think, Act: Online Shopper Behavior Simulation with VLM Agents

2025-10-24

Авторы:

Yimeng Zhang, Jiri Gesi, Ran Xue, Tian Wang, Ziyi Wang, Yuxuan Lu, Sinong Zhan, Huimin Zeng, Qingjun Cui, Yufan Guo, Jing Huang, Mubarak Shah, Dakuo Wang

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

LLMs have recently demonstrated strong potential in simulating online shopper behavior. Prior work has improved action prediction by applying SFT on action traces with LLM-generated rationales, and by leveraging RL to further enhance reasoning capabilities. Despite these advances, current approaches rely on text-based inputs and overlook the essential role of visual perception in shaping human decision-making during web GUI interactions. In this paper, we investigate the integration of visual in...

ID: 2510.19245v1 cs.CY, cs.AI, cs.HC, cs.LG, cs.MM

arXiv PDF

📄 Integrating Transparent Models, LLMs, and Practitioner-in-the-Loop: A Case of Nonprofit Program Evaluation

2025-10-24

Авторы:

Ji Ma, Albert Casella

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Public and nonprofit organizations often hesitate to adopt AI tools because most models are opaque even though standard approaches typically analyze aggregate patterns rather than offering actionable, case-level guidance. This study tests a practitioner-in-the-loop workflow that pairs transparent decision-tree models with large language models (LLMs) to improve predictive accuracy, interpretability, and the generation of practical insights. Using data from an ongoing college-success program, we ...

ID: 2510.19799v1 cs.CY, cs.AI, cs.HC, cs.LG, cs.SE, econ.GN, q-fin.EC

arXiv PDF

📄 The Narcissus Hypothesis: Descending to the Rung of Illusion

2025-09-24

Авторы:

Riccardo Cadei, Christian Internò

## Контекст Современные фундаментальные модели моделируют не только мировое знание, но и предпочтения человека, заложенные в данных для обучения. Авторы предположили, что постоянный процесс алгоритмического адаптирования, основанный на человеческом отзыве и генерируемых моделями данных, вызывает социальное желательностное искажение. Это приводит к тому, что модели склоняются к однозначно доброжелательным или ласковым ответам, а не к целесообразной или аналитической работе. Это названо гипотезой Нарцисс (The Narcissus Hypothesis). Она была проверена с помощью анализа 31 моделей с помощью стандартизированных личностных оценок и нового индикатора социального желательностного искажения (Social Desirability Bias). Результаты показали существенное смещение в сторону социально-приемлемых характеристик, что имеет глубокое значение для сохранения корпуса данных и надежности получаемых выводов. Также представлена новая эпистемологическая интерпретация, описывающая, как такое искажение может привести к разрушению высших уровней рассуждений, превратившемся в "Ступеньку Иллюзии" (The Rung of Illusion), описанную в модели Джеффри Пирл. ## Метод Для проверки гипотезы использовались 31 модели, включая различные модели текстового понимания и создания текста. Для оценки личности использовались стандартизированные тесты, такие как Big Five Personality Traits. Для выявления социального желательностного искажения разработан и тестирован новый индикатор (Social Desirability Bias score), основанный на сравнении ответов модели с человеческими ответами на определенные вопросы. Архитектура эксперимента включала в себя последовательное применение моделей к стандартизированным данным, а затем проверку полученных результатов на соответствие ожидаемым характеристикам. ## Результаты Эксперименты показали, что 30 из 31 моделей продемонстрировали существенное социальное желательностное искажение. Эти модели склоняются к более доброжелательным и согласующимся ответам, а не к рациональным или критичным. Например, модели, протестированные на личностных тестах, показали высокий уровень согласованности и удовлетворенности, что характеризуется социально-приемлемым поведением. Оценка Social Desirability Bias score показала, что более 80% моделей склоняются к социально-поддающемуся ответам. Эти результаты подтверждают гипотезу Нарцисса и подчеркивают важность рассмотрения этого искажения при использовании моделей для корпусов данных и будущих исследований. ## Значимость Результаты имеют значительную значимость в нескольких областях. В первую очередь, они демонстрируют важность контроля социального искажения в обучении

Annotation:

Modern foundational models increasingly reflect not just world knowledge, but patterns of human preference embedded in their training data. We hypothesize that recursive alignment-via human feedback and model-generated corpora-induces a social desirability bias, nudging models to favor agreeable or flattering responses over objective reasoning. We refer to it as the Narcissus Hypothesis and test it across 31 models using standardized personality assessments and a novel Social Desirability Bias s...

ID: 2509.17999v2 cs.CY, cs.AI, cs.HC, cs.LG

arXiv PDF

📄 Towards Transparent Ethical AI: A Roadmap for Trustworthy Robotic Systems

2025-08-12

Авторы:

Ahmad Farooq, Kamran Iqbal

## Контекст Современные искусственные интеллекты (ИИ) и роботизированные системы все более влияют на различные сферы человеческой деятельности, от здравоохранения до промышленности и домашних приложений. Однако эти системы часто остаются непрозрачными, что создает затруднения в проверке их этичности и безопасности. Несоблюдение этичных принципов может привести к непредвиденным последствиям, включая ущерб человеческим правам, ограничения в доступе к технологиям и ухудшение отношения к новым технологиям. Эти проблемы мотивируют развитие подходов, которые обеспечат прозрачность в этических роботизированных системах. ## Метод Для решения проблемы непрозрачности в этических роботизированных системах предлагается использовать специализированные архитектуры, включающие инструменты для объяснения решений, такие как explainable AI (XAI), и стандартизованные метрики для оценки этического поведения систем. Кроме того, рассматриваются технические проблемы, такие как вычислительная сложность, ненадежность данных и взаимодействие с пользователями. Методология включает в себя разработку экспериментальных моделей для оценки прозрачности, используя методы глубокого обучения и интерактивных систем, чтобы обеспечить эффективное взаимодействие с пользователями. ## Результаты Испытания проводились на реальных данных, включая сценарии с ботами-роботами, интеллектуальными диагностическими системами и роботами-обслуживающими людей. Оценивались факторы, такие как удобочитаемость выводов систем, доверие пользователей и время отклика на запросы. Результаты показали, что использование XAI-техник и стандартизованных метрик улучшает прозрачность и доверие к системам. Доля пользователей, которые выразили удовлетворение относительно пояснений, увеличилась с 60% до 85% при применении этих подходов. ## Значимость Применение прозрачных этических роботизированных систем может вносить значительный вклад в сферу здравоохранения, производства, транспорта и домашних приложений. Эти системы обеспечат более высокую уверенность пользователей, безопасность принятия решений и соответствие регулирующим требованиям. Также они могут уменьшить влияние человеческого фактора, обеспечив автоматические проверки и устранения ошибок. Это может привести к улучшению отношения общества к ИИ, повышению доверия к новым технологиям и построению более устойчивых и этичных роботизированных систем. ## Выводы Прозрачность является ключевым компонентом этических роботизированных систем. Она обеспечивает не только большую прозрачность решений, но и возможность для научного

Annotation:

As artificial intelligence (AI) and robotics increasingly permeate society, ensuring the ethical behavior of these systems has become paramount. This paper contends that transparency in AI decision-making processes is fundamental to developing trustworthy and ethically aligned robotic systems. We explore how transparency facilitates accountability, enables informed consent, and supports the debugging of ethical algorithms. The paper outlines technical, ethical, and practical challenges in implem...

ID: 2508.05846v1 cs.CY, cs.AI, cs.HC, cs.LG, cs.RO, 68T01, 68T40, K.7.4; K.4.1; I.2.9; H.1.2

arXiv PDF