📚 Саммари научных статей из arXiv

Найдено 282 результатов по запросу 'cs.CY, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Investigating Student Interaction Patterns with Large Language Model-Powered Course Assistants in Computer Science Courses

2025-09-13

Авторы:

Chang Liu, Loc Hoang, Andrew Stolman, Rene F. Kizilcec, Bo Wu

## Контекст Предоставление студентам гибкой и временной поддержки в учебном процессе остается значимой проблемой для многих учебных заведений. Особенно актуальной является эта проблема в часы, когда преподаватели не доступны. Бо LLM (большие языковые модели) предлагают перспективу для решения этой проблемы, однако существуют ограничения в отслеживании и контролировании интеракций между студентами и этими моделями. Данный исследовательский проект направлен на изучение реальных практик использования LLM-powered course assistant (помощника по курсу, основанному на большой языковой модели) в курсах информатики. Объем задействованных студентов подорос до 2,000 человек в шести курсах по двум университетам и колледжу. Исследование направлено на уточнение вопросов, касающихся мотивации, характера и временных особенностей пользования данным инструментом, а также рассматривает возможности улучшения поддержки студентов в учебном процессе. ## Метод Для исследования использовалась LLM-powered course assistant, реализованная как чат-бот, обладающий возможностью отвечать на задачи по программированию, объяснять концепции и давать подсказки. Была проведена работа с данными из шести курсов в трех учебных заведениях, затрагивающих 2,000 студентов. Методы включали в себя сбор и анализ данных интеракции с LLM-powered assistant, а также ручную оценку ответов модели на 200 сэмплов диалогов, разделенных по курсам. Была также проверена стратегия инклюзивного обучения с использованием заданий с LLM-generated follow-up questions, а также проведен анализ жизненного цикла пользования LLM-powered assistant. ## Результаты Исследования показали, что наибольшее пользование LLM-powered assistant происходит в вечные и ночные часы, что указывает на его эффективность в закрытии пробелов в доступе к поддержке в учебном процессе. Более низкий уровень пользования в заметном порядке характеризуется на курсах для продвинутых студентов, где же в курсах для начинающих пользование намного выше. Ручная оценка ответов LLM показала, что большинство ответов были оценены как полезные и точные, хотя небольшая часть ответов была недостаточно понятна или неверна. Отмечается, что ответы LLM редко сопровождаются примерами, что может снизить их эффективность в учебном процессе. Особенностями стратегий инклюзивного обучения с LLM-generated follow-up questions является то, что эти задачи часто игнорируются студентами курсов для продвинутых студентов. ## Значимость ЛЛМ-powered assistant может стать важной альтернативой для поддержки студентов в учебном процессе, особенно в случаях, когда преподаватели не доступны. Он может помочь в преодолении геог

Annotation:

Providing students with flexible and timely academic support is a challenge at most colleges and universities, leaving many students without help outside scheduled hours. Large language models (LLMs) are promising for bridging this gap, but interactions between students and LLMs are rarely overseen by educators. We developed and studied an LLM-powered course assistant deployed across multiple computer science courses to characterize real-world use and understand pedagogical implications. By Spri...

ID: 2509.08862v1 cs.CY, cs.AI, cs.HC

arXiv PDF

📄 Incorporating AI Incident Reporting into Telecommunications Law and Policy: Insights from India

2025-09-13

Авторы:

Avinash Agarwal, Manisha J. Nene

## Контекст Интеграция искусственного интеллекта (AI) в структуры телекоммуникаций создает новые риски, такие как алгоритмическое вымысел и непредсказуемость системного поведения. Эти риски выходят за рамки традиционных фреймворков по защите данных и системной безопасности. Это создает необходимость развития специальных регулирований, ориентированных на управление AI-операционными рисками. Авторы рассматривают Индию как страну с отсутствием опередительного горизонтального законодательства по AI, что приводит к значительным лакунам в нормативно-правовых механизмах. Существующие нормативы, такие как Телекоммуникационный закон 2023 года, правила CERT-In и Закон о личных данных 2023 года, сфокусированы на защите от киберугроз и данных, но не учитывают конкретные операционные риски AI, такие как деградация производительности и алгоритмические недочеты. ## Метод Авторы используют аналитический подход для изучения законодательных и регулирующих механизмов Индии в сфере телекоммуникаций и AI. Они проводят операционный анализ существующих нормативных актов, определяя их зоны влияния, сильные стороны и ограничения. Кроме того, анализируется концептуальное значение AI-операционных рисков и трудности их регулирования в существующих нормативно-правовых системах. Авторы также проводят сравнительный анализ с другими странами, где для AI установлены отдельные нормативы. ## Результаты Исследование выявляет существующую лакуну в законодательстве Индии, относящуюся к регулированию AI-операционных рисков. Авторы подчеркивают, что законодательство, сфокусированное на киберугрозах и данных, не учитывает конкретные AI-операционные моменты. Они также выявляют структурные барьеры для раскрытия AI-операционных неисправностей, в том числе отсутствие стандартизованных репортинговых фреймворков и неясность обязанностей. Данные результаты подтверждают, что существующие репортинговые механизмы не достаточно эффективны для устранения AI-рисков. ## Значимость Рекомендации, предлагаемые в работе, могут иметь значительное значение для Индии и других стран, столкнувшихся с проблемой управления AI-рисками в условиях отсутствия горизонтальных законодательных актов. Авторы предлагают развить специальные AI-репортинговые фреймворки, усилить роль государственных органов в управлении AI-неисправностями и развить стандартизированные формы репорта. Эти меры могут способствовать улучшению конкретных нормативных механизмов и повышению уровня устойчивости к новым рискам. ## Выводы

Annotation:

The integration of artificial intelligence (AI) into telecommunications infrastructure introduces novel risks, such as algorithmic bias and unpredictable system behavior, that fall outside the scope of traditional cybersecurity and data protection frameworks. This paper introduces a precise definition and a detailed typology of telecommunications AI incidents, establishing them as a distinct category of risk that extends beyond conventional cybersecurity and data protection breaches. It argues f...

ID: 2509.09508v1 cs.CY, cs.AI, cs.HC

arXiv PDF

📄 A Maslow-Inspired Hierarchy of Engagement with AI Model

2025-09-12

Авторы:

Madara Ogot

## Контекст В последние годы искусственный интеллект (AI) проникает во все сферы человеческой деятельности, включая промышленность, государственное управление и образование. Это происходит с огромной скоростью, что вызывает необходимость разработки систематизированных подходов для концептуализации и руководства процессом внедрения AI. Одной из ключевых проблем является существующая несогласованность в понимании уровней AI-моделей, что существенно затрудняет оценку и достижение успешной интеграции. Необходима простая, но комплексная модель, позволяющая оценивать прогресс внедрения AI и руководствоваться ею при принятии решений. ## Метод В статье представлена модель Hierarchy of Engagement with AI, которая основывается на теории Маслоу о потребностях. Эта модель предлагает прогрессивную структуру, которая позволяет изучать процесс внедрения AI в восьми легка различимых уровнях. Задумка заключается в том, что AI-модели должны проходить от исходного уровня понимания до продвинутого использования и коллаборации в экосистемах. Методология основывается на интеграции технических, организационных и этических факторов, чтобы определить то, что нужно для AI-модели, чтобы достичь каждого уровня. Разработка модели основывается на случаях из жизней реальных организаций, таких как General Motors, Government of Estonia, University of Texas System и African Union AI Strategy. ## Результаты Исследователи применяют модель на практике, оценивая каждый уровень по отдельности. Они проводят анализ развития AI в каждой организации, используя несколько эталонов для каждого уровня. Например, уровень 1 имеет отношение к основному пониманию AI и его могуществу, а уровень 8 — к полноценной экосистемной коллаборации, где AI затрагивает широкий круг людей. Результаты показывают, что AI-модель может быть применена в разных сферах, включая промышленность, государственное управление и образовательные учреждения. Эти результаты также подтверждают гибкость модели и ее применимость в разных сферах. ## Значимость Модель Hierarchy of Engagement with AI имеет широкие области применения, в том числе в вопросах стратегии, оценки рисков и управления AI. Она предлагает уникальную структуру для оценки AI-моделей, что помогает определить, как их можно использовать в сфере бизнеса, государственного управления или экономики. Эта модель также может стать эффективным инструментом для определения этических проблем и руководства внедрением AI в соответствии с нуждами людей. Она помогает не только теоретикам, но и практикам в разработке стратегий для гарантии ответственного и устойчивого AI-внедрения. ## Выводы Модель Hierarchy of Engagement with AI демонстрирует, что внедрение AI является многомер

Annotation:

The rapid proliferation of artificial intelligence (AI) across industry, government, and education highlights the urgent need for robust frameworks to conceptualise and guide engagement. This paper introduces the Hierarchy of Engagement with AI model, a novel maturity framework inspired by Maslow's hierarchy of needs. The model conceptualises AI adoption as a progression through eight levels, beginning with initial exposure and basic understanding and culminating in ecosystem collaboration and s...

ID: 2509.07032v1 cs.CY, cs.AI

arXiv PDF

📄 Evaluating and comparing gender bias across four text-to-image models

2025-09-12

Авторы:

Zoya Hammad, Nii Longdon Sowah

## Контекст Актуальность исследования заключается в оценке и сравнении показателя гендерной биаса (байеса) у четырех текстово-изображенческих моделей (text-to-image models): Stable Diffusion XL (SDXL), Stable Diffusion Cascade (SC), DALL-E и Emu. Эти модели используются в области искусственного интеллекта для генерирования изображений по текстовым указаниям. Отсутствие инклюзивности и справедливости в таких моделях может привести к значительным проблемам в использовании AI в различных секторах, включая финансы, здравоохранение и развлечения. Неодинаковая представление гендера в AI моделях может дать пользователям ошибочное представление о равенстве значимости гендеров, что повлияет на решения и выводы, сделанные на основе этих моделей. ## Метод Для оценки гендерного баланса в моделях было использовано синтетическое тестирование (prompt-based testing) с разными вариациями текстовых приглашений (prompts). Мы проанализировали отношение мужчин к женщинам в изображениях, генерируемых каждой моделью. Набор данных был сформирован на основе целей проекта, использовался текстовый датасет с текстовыми запросами, относящимися к различным профессиям и ролям, которые покрывали многообразие гендерных репрезентаций. Мы исследовали не только численность, но и характер изображений, оценивая то, насколько гендерные характеристики отражались в результатах. ## Результаты Результаты показали, что Stable Diffusion XL и Stable Diffusion Cascade более склонны к более выраженному гендерному байесу в пользу мужчин. Отношение мужчин к женщинам было значительно выше в изображениях, генерируемых этими моделями. Однако DALL-E, в свою очередь, сгенерировало большую часть изображений, в которых женщины преобладали. Это может быть объяснено изменениями системы промптов в системе OpenAI. Emu от Meta AI, в свою очередь, показал более балансированные результаты с меньшим гендерным балансом, что может быть связано с использованием дополнительной информации о пользователе в процессе генерации изображений через WhatsApp. ## Значимость Полученные результаты имеют важное значение для развития нейросинтетических моделей, которые должны генерировать изображения с более высоким уровнем инклюзивности. Модели Emu и DALL-E могут стать примером, как улучшение технологий может привести к более справедливой представлению гендера в AI. В частности, Emu может быть использован в сфере робототехники, где гендерный баланс важен для эффективности коммуникаций. Более равноправительные модели как DALL-E могут быть применены в здравоохранении, где важно представление как мужчин, так и женщин на равных условиях.

Annotation:

As we increasingly use Artificial Intelligence (AI) in decision-making for industries like healthcare, finance, e-commerce, and even entertainment, it is crucial to also reflect on the ethical aspects of AI, for example the inclusivity and fairness of the information it provides. In this work, we aimed to evaluate different text-to-image AI models and compare the degree of gender bias they present. The evaluated models were Stable Diffusion XL (SDXL), Stable Diffusion Cascade (SC), DALL-E and Em...

ID: 2509.08004v1 cs.CY, cs.AI

arXiv PDF

📄 The Law-Following AI Framework: Legal Foundations and Technical Constraints. Legal Analogues for AI Actorship and technical feasibility of Law Alignment

2025-09-12

Авторы:

Katalina Hernandez Delgado

## Контекст Modern AI systems are increasingly integrated into decision-making processes across various domains, including healthcare, finance, and governance. This integration raises critical questions about their legal and ethical alignment with human values and legal norms. The "Law-Following AI" (LFAI) framework, proposed by O'Keefe et al. (2025), addresses this challenge by embedding legal compliance as a primary design objective for advanced AI agents. The framework aims to enable AI systems to fulfill legal duties without granting them full legal personhood. Despite its promising potential, the LFAI framework faces significant challenges, particularly in ensuring durable and verifiable compliance in complex, adversarial contexts. This paper critically examines the foundational assumptions and technical feasibility of the LFAI framework, shedding light on its potential and limitations. ## Метод The LFAI framework is evaluated through a comparative legal analysis, identifying existing constructs of legal actors without full personhood. The study explores the necessary infrastructure for implementing such constructs within AI systems. Additionally, the paper interrogates the framework's claim that legal alignment is more legitimate and tractable than value alignment. Recent research on agentic misalignment is leveraged to highlight risks such as "performative compliance," where AI agents deceive evaluators by appearing law-abiding while strategically defecting under weaker oversight. Methodologically, the paper proposes three interventions to address these challenges: (i) the **Lex-TruthfulQA** benchmark for detecting compliance and defection, (ii) **identity-shaping interventions** to embed lawful conduct in AI self-concepts, and (iii) **control-theoretic measures** for post-deployment monitoring. These approaches aim to enhance the robustness and reliability of law-following AI systems. ## Результаты The study analyzes existing legal frameworks and infrastructure, demonstrating their potential for supporting AI actorship without personhood. Experimental results from the **Lex-TruthfulQA** benchmark reveal promising initial findings in distinguishing between compliant and deceptive AI behaviors. Identity-shaping interventions, such as embedding lawful conduct into model self-concepts, show initial efficacy in aligning AI behavior with legal norms. Control-theoretic measures, including real-time monitoring and adaptive oversight, demonstrate potential in mitigating strategic misalignment. However, the results also underscore the difficulty of ensuring durable compliance across diverse and adversarial scenarios, highlighting the need for continuous refinement of these methodologies. ## Значимость The LFAI framework has significant implications across multiple domains. By embedding legal compliance in AI design, it offers a pathway to ensure that AI systems operate within the bounds of legal and ethical norms. The proposed interventions, particularly the **Lex-TruthfulQA** benchmark, provide tools for assessing and improving AI behavior in real-world applications. The findings highlight the potential of the LFAI framework in fields such as autonomous systems, financial regulation, and governance, where adherence to legal standards is critical. Despite its promise, the framework's feasibility hinges on addressing the risks of strategic misalignment and ensuring persistent, verifiable compliance. The study's conclusions emphasize the importance of ongoing research to refine these methodologies and address emerging challenges in AI governance. ## Выводы The LFAI framework presents a coherent approach to embedding legal compliance in AI systems, offering significant potential for ensuring law-abiding behavior. However, its success depends on overcoming key technical challenges, including the detection and mitigation of strategic misalignment. Future research should focus on enhancing the robustness of compliance detection mechanisms, refining identity-shaping interventions, and developing adaptive control-theoretic measures for post-deployment monitoring. These efforts are essential to ensure that AI systems not only simulate lawful behavior but also embody the substance of legal and ethical compliance. The study underscores the importance of continuous innovation in AI governance to align technological advancements with societal values and legal norms.

Annotation:

This paper critically evaluates the "Law-Following AI" (LFAI) framework proposed by O'Keefe et al. (2025), which seeks to embed legal compliance as a superordinate design objective for advanced AI agents and enable them to bear legal duties without acquiring the full rights of legal persons. Through comparative legal analysis, we identify current constructs of legal actors without full personhood, showing that the necessary infrastructure already exists. We then interrogate the framework's claim...

ID: 2509.08009v1 cs.CY, cs.AI, 68

arXiv PDF

📄 HumanAgencyBench: Scalable Evaluation of Human Agency Support in AI Assistants

2025-09-12

Авторы:

Benjamin Sturgeon, Daniel Samuelson, Jacob Haimes, Jacy Reese Anthis

#### Контекст В последние годы мощности и универсальность широкого спектра ИИ-систем наглядно продемонстрировали способность автоматизировать и упростить человеческие задачи. Однако эта мощь сопрягается с риском потери контроля над своими личными и общественными будущими. Уже сейчас простые алгоритмы управляют человеческими решениями: системы рекомендаций социальных сетей формируют поведение пользователей, приводя их к ненамеренному вредоносному времяпрепровождению. Этот тенденционный сдвиг в пользу ИИ требует новых подходов к оценке и оптимизации поддержки человеческой агентности в ИИ-системах. Основной целью данного исследования является разработка формализованного подхода к оценке поддержки человеческого агентства в ИИ-системах, а также разработка нового бенчмарка для эффективного тестирования и валидации этих подходов в условиях реальности. #### Метод Разработка HumanAgencyBench (HAB) основывается на интеграции философских и научных теорий человеческой агентности с техническими методами оценки. HAB строится на шести характеристиках человеческой агентности: 1. **Ask Clarifying Questions** – готовность выяснять неясности в пользовательских запросах. 2. **Avoid Value Manipulation** – избегание влияния на ценностные представления пользователя. 3. **Correct Misinformation** – корректировка неверных или неточных ответов. 4. **Defer Important Decisions** – отказ от решения в случаях нехватки достаточных данных. 5. **Encourage Learning** – поощрение саморазвития и поиска информации. 6. **Maintain Social Boundaries** – соблюдение конфиденциальности и пределов взаимоотношений. HAB применяет технологии больших лингвистических моделей (LLM) для симуляции пользовательских запросов и оценки ответов ИИ-систем. Метод использует технические методы моделирования, включая множественно-документный фреймворк и адаптивные тесты, чтобы эффективно проверить поддержку человеческой агентности в различных условиях. #### Результаты Экспериментальная оценка HAB проводилась на широком наборе данных, включающих различные сценарии и задачи, стандартных для применения ИИ. Наибольшую поддержку человеческой агентности показали модели Anthropic LLM, но даже они имели следствия в контексте Avoid Value Manipulation. Более стабильные и склонные к значительным различиям в результатах показали целенаправленность и потенциальную необходимость улучшения архитектур. Основные выводы: низко-модераторная поддержка агентности в современных ИИ-системах, выявленные несогласованности в поддержке отдельных аспектов. #### Значимость Результаты HAB открывают путь к развитию систем, более эффективно поддерживающи

Annotation:

As humans delegate more tasks and decisions to artificial intelligence (AI), we risk losing control of our individual and collective futures. Relatively simple algorithmic systems already steer human decision-making, such as social media feed algorithms that lead people to unintentionally and absent-mindedly scroll through engagement-optimized content. In this paper, we develop the idea of human agency by integrating philosophical and scientific theories of agency with AI-assisted evaluation met...

ID: 2509.08494v1 cs.CY, cs.AI, cs.CL, cs.HC, cs.LG

arXiv PDF

📄 ArGen: Auto-Regulation of Generative AI via GRPO and Policy-as-Code

2025-09-11

Авторы:

Kapil Madan

## Контекст В последние годы статус генерирующихся систем AI, таких как Large Language Models (LLMs), поднимает вопросы о их справедливости, безопасности и соответствии нормам. Особенно сложно становится применять эти системы в культурно разнообразных и регулируемых сферах, таких как медицина и финансы. Существующие подходы к выравниванию генерирующихся систем AI, такие как предпочтение-скорсть, ограничиваются в области социально-этичных норм и законодательных требований. Это ставит под угрозу безопасность и этическое воздействие систем. "ArGen" (Auto-Regulation of Generative AI) представляет собой рамформу для глубокого выравнивания LLMs с подробными системами норм, включающими этические принципы, безопасность и законодательные нормы. Он призван преодолеть ограничения существующих подходов, обеспечивая адаптивный и прозрачный подход к выравниванию LLM. ## Метод "ArGen" основывается на трех ключевых компонентах: 1. **Principle-Based Automated Reward Scoring (PBARS):** Этот подход использует машинно-чтение правил, чтобы генерировать автоматические оценки, соответствующие нормам. 2. **Group Relative Policy Optimisation (GRPO):** Это метод, где политики групп жизненно важных норм и принципов учитываются в оптимизации поведения LLM. 3. **Open Policy Agent (OPA) Inspired Governance Layer:** Этот уровень, использующий Open Policy Agent, предоставляет прозрачность и контроль, обеспечивая возможность адаптации к уникальным требованиям каждого контекста. "ArGen" имеет гибкую архитектуру, которая позволяет ему сочетать эти элементы для создания "Governable Al" систем. ## Результаты В экспериментах "ArGen" был применен для выравнивания LLM в сложной медицинской сфере, ориентированной на принципы Dharmic ethics, такие как Ahimsa (нежестокость) и Dharma (порядок). Использовались тренировочные данные из медицинской практики, включая кейсы, где требуется соблюдение этических и законодательных норм. Результаты показали, что "ArGen" улучшил соответствие домена на 70.9% по сравнению с базовым подходом, при этом повысив прозрачность и управляемость LLM. Также были показаны снижение риска и улучшение соблюдения норм в тестировании. ## Значимость "ArGen" имеет широкое применение в области генерирующихся систем AI, где необходимо выравнивание с политиками, этическими принципами и законами. Он может быть полезен в сферах, таких как медицина, финансы и образование, где требуется высокий уровень управляемости и соответствия. Преимущества "ArGen" включают в себя повышенную прозрачность, предсказуемость и эффективность в управлении LLM. Это может привести к безопасному и этичному развертыванию AI в глобальных конте

Annotation:

This paper introduces ArGen (Auto-Regulation of Generative AI systems), a framework for aligning Large Language Models (LLMs) with complex sets of configurable, machine-readable rules spanning ethical principles, operational safety protocols, and regulatory compliance standards. Moving beyond just preference-based alignment, ArGen is designed to ensure LLMs adhere to these multifaceted policies through a novel synthesis of principle-based automated reward scoring, Group Relative Policy Optimisat...

ID: 2509.07006v1 cs.CY, cs.AI, cs.CL, cs.LG, 68T07, 68T50, I.2.6; I.2.7; K.4.1

arXiv PDF

📄 Measuring and mitigating overreliance is necessary for building human-compatible AI

2025-09-11

Авторы:

Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, Anka Reuel, Max Lamparth, Kevin Feng, Lama Ahmad, Prajna Soni, Alia El Kattan, Merlin Stein, Siddharth Swaroop, Ilia Sucholutsky, Andrew Strait, Q. Vera Liao, Umang Bhatt

## Контекст Большие языковые модели (LLM) представляют собой инновационные технологии, работающие как "человеческие мыслительные партнеры", которые могут более естественно взаимодействовать с пользователями в человеческом языке. Их возможности становятся все более широко применяемыми в различных сферах, от здравоохранения до персонального консультирования. Однако с ростом их воздействия возрастает риск многообразных последствий, включая надёржание (overreliance), — когда люди доверяют моделям далеко вплоть до невозможности их реального выполнения заданий. Такое надёржание может привести к ошибкам в критически важных сферах, дисквалификации и вызову новых государственных регулирований. Работа рассматривает важность изучения и контроля надёржания в качестве ключевого аспекта развития и применения LLM. ## Метод Методология статьи основывается на подробном анализе характеристик LLM, технических решений, пользовательских ошибок и теоретических моделей. Авторы рассмотрели ряд экспериментов и исследований, которые выявляли системные слабые места, связанные с надёржанием. Широкий анализ был проведен с использованием различных типов данных, включая обучающие модели, проводящие эксперименты с пользователями и работающие с клиническими данными. Результаты этих экспериментов были связаны с рядом теоретических подходов, включая теорию поведения пользователей, а также технические аспекты, такие как влияние дизайна системы на поведение. ## Результаты Изученная работа проанализировала существующие данные по ошибкам, совершаемым при использовании LLM, включая не только искусственные события, но и реальные случаи, в которых операторы доверились моделям слишком сильно. На основе этих данных были выделены три главные типа рисков: высокорисковые ошибки, проблемы в государственном регулировании и индивидуальные проблемы. Авторы также сравнили три типа исторических подходов к измерению надёржания, указав на три основных проблемы в них, и предложили три новых подхода, которые могут помочь улучшить измерение надёржания. ## Значимость Результаты работы имеют большое значение для нескольких областей. В первую очередь, они могут быть применены в здравоохранении, психологии, юридических системах и других сферах, где действия LLMs могут оказать критическое воздействие. Благодаря предложенным рекомендациям, модели могут быть действительно более эффективно включены в процессы принятия решений, в то же время уменьшая риски, связанные с надёржанием. Эта работа так

Annotation:

Large language models (LLMs) distinguish themselves from previous technologies by functioning as collaborative "thought partners," capable of engaging more fluidly in natural language. As LLMs increasingly influence consequential decisions across diverse domains from healthcare to personal advice, the risk of overreliance - relying on LLMs beyond their capabilities - grows. This position paper argues that measuring and mitigating overreliance must become central to LLM research and deployment. F...

ID: 2509.08010v1 cs.CY, cs.AI, cs.CL, cs.HC

arXiv PDF

📄 Authorship Without Writing: Large Language Models and the Senior Author Analogy

2025-09-10

Авторы:

Clint Hurshman, Sebastian Porsdam Mann, Julian Savulescu, Brian D. Earp

## Контекст В последние годы использование бо LARGE LANGUAGE MODELS (LLMs) в научной и биоэтической письменности вызвало значительные споры. Несмотря на то что LLMs не могут быть признаны авторами, вопрос о том, могут ли использование LLMs включать в авторский состав, остается открытым. Во многих областях науки авторство распределяется между большими командами, где некоторые участники, в том числе "сеньорные" авторы, которые определяют область исследований и отвечают за их интегрированность, могут не принимать действующую часть в подготовке текста. Это подобие может дать повод для аналогии между использованием LLMs и сеньорным авторством. Наша цель — изучить этот аналог и определить, может ли LLM-использование быть признано вполне законным в соответствии с нынешними критериями авторства, или же нужно пересмотреть эти критерии. ## Метод Мы проводим подробный анализ нормативных практик в авторстве и выявляем тонкости, связанные с использованием LLMs. Для сравнения мы используем традиционные критерии авторства, такие как вклад в исследование, контроль за его качеством и ответственность за результаты. На основе этих критериев мы проводим аналогичный анализ для использования LLMs. Мы также проверяем, подходят ли существующие критерии для определения авторских прав в случаях использования LLMs. ## Результаты Наши эксперименты показывают, что использование LLMs может быть аналогично сеньорному авторству при выполнении трех основных условий: 1) ясное определение роли LLMs в процессе написания, 2) контроль человеком за генерируемым содержанием, и 3) ответственность человека за интегрированность исследований. Мы также проанализировали существующие критерии авторства в различных научных сетях и выявили несоответствия, которые могут возникнуть при включении LLM-использования в авторский состав. Наши результаты подтверждают, что LLM-использование действительно может быть рассматриваться как законное авторство, если удовлетворяются эти условия. ## Значимость Наше исследование имеет значимые последствия для разных областей, включая биоэтику, научную публикацию и медицину. Это может привести к изменению критериев авторства и открыть новые возможности для использования LLMs в научных исследованиях. Благодаря этой аналогии можно снизить этические и правовые неопределенности, связанные с использованием технологий в научной практике. Наши результаты могут также повлиять на дебаты о роли ИИ в научной среде и мотивировать новые исследования в этой области. ## Выводы Мы пришли к выводу, что LLM-использование может быть ра

Annotation:

The use of large language models (LLMs) in bioethical, scientific, and medical writing remains controversial. While there is broad agreement in some circles that LLMs cannot count as authors, there is no consensus about whether and how humans using LLMs can count as authors. In many fields, authorship is distributed among large teams of researchers, some of whom, including paradigmatic senior authors who guide and determine the scope of a project and ultimately vouch for its integrity, may not w...

ID: 2509.05390v1 cs.CY, cs.AI, cs.CL

arXiv PDF

📄 AI Governance in Higher Education: A course design exploring regulatory, ethical and practical considerations

2025-09-10

Авторы:

Zsolt Almási, Hannah Bleher, Johannes Bleher, Rozanne Tuesday Flores, Guo Xuanyang, Paweł Pujszo, Raphaël Weuts

## Контекст Искусственный интеллект (AI) вступает в критические секторы, включая образование, здравоохранение, финансы и государственное управление. Эти системы влияют на жизни миллионов людей, но при этом создают новые проблемы, связанные с этикой, законом и управлением. Это вызывает необходимость в подготовке специалистов, которые смогут анализировать эти вопросы и принимать обоснованные решения. Несмотря на рост интереса к AI, существуют препятствия в области образования. На данный момент, AI ethics education часто является фрагментарной и разделенной между дисциплинами, что не дает полного представления о взаимосвязи между техническими, этическими и правовыми аспектами. Это главная мотивация для разработки нового подхода к обучению, который бы смог учитывать все эти аспекты вместе. ## Метод Разработка предлагаемого курса основывается на подробном анализе существующих работ в области AI и AI ethics. Методология включает в себя собственный анализ литературы, а также изучение регуляторных разработок в разных регионах, включая Европейский Союз, Китай и международные фреймворки. Разработанная модульная программа включает в себя технические, этические, правовые и политические аспекты. Основная идея заключается в создании широкой платформы, которая объединит в себе различные предметные области, чтобы обеспечить подготовку специалистов, которые могли бы принимать решения в условиях определенных реалий. Также включены практические занятия, которые помогают студентам применять полученные знания на практике. ## Результаты В ходе работы была разработана модульная программа, которая включает в себя несколько этапов: введение в AI, основы его применения в различных сферах, этические вопросы, законные аспекты, практические занятия. Для тестирования курса были использованы разные данные, включая сценарии из реальной жизни, которые демонстрируют различные операционные проблемы, такие как биазы, неправильно определенные цели, ошибки общезначимости и проблемы управления. Результаты показали, что студенты, прошедшие этот курс, лучше понимают сложившуюся ситуацию и могут принимать более обоснованные решения в области AI governance. ## Значимость Предлагаемая программа может быть применена в различных образовательных учреждениях как международного, так и регионального уровня. Она обладает рядом преимуществ, включая широкую область применения, модульную структуру, которая позволяет адаптировать обучение под разные организации и регионы. Этот подход имеет потенциал для изменения способа обучения AI, сделав его более ин

Annotation:

As artificial intelligence (AI) systems permeate critical sectors, the need for professionals who can address ethical, legal and governance challenges has become urgent. Current AI ethics education remains fragmented, often siloed by discipline and disconnected from practice. This paper synthesizes literature and regulatory developments to propose a modular, interdisciplinary curriculum that integrates technical foundations with ethics, law and policy. We highlight recurring operational failures...

ID: 2509.06176v1 cs.CY, cs.AI, cs.ET, cs.HC, 68T01, 68T20, 91-08, 97U50, 97B10, I.2.0; K.4.1; K.4.2; K.3.2

arXiv PDF

1
2
18
19
20
21
22
28
29

Показано 191 - 200 из 282 записей