📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 How Large Language Models are Designed to Hallucinate

2025-09-24

Авторы:

Richard Ackermann, Simeon Emanuilov

## Контекст Крупные языковые модели (LLMs) поражают своей грамотностью и мощью в решении широкого спектра задач языкового понимания и рационального мышления. Однако они остаются чувствительными к "халлуцинациям" — ситуациям, когда модель генерирует необоснованные или недостоверные ответы. Это объясняется различными факторами: неполноту или несогласованность тренировочных данных, ограниченность контекста или ошибки оптимизации. Наша исследовательская мотивация заключается в том, чтобы понять, почему такие модели так часто "халлуцинируют", и выявить основные причины этого явления. Мы считаем, что это не является простой ошибкой, а является структурным результатом их архитектуры, в частности, трансформеров. ## Метод Мы привлекаем подходы из философии, особенно теории сущности (ontology) Мартина Хайдеггера, чтобы проанализировать проблему халлуцинаций в LLMs. Хайдеггер описывает сущность как связанный с миром и жизненным опытом субъект, который может "открыть" и "закрыть" в своем познавательном процессе. Мы используем эти концепции для развития новых категорий халлуцинаций, таких как "онтологическая" (относящаяся к открытию сущностей в мире) и "результат рассуждений" (когда модель продолжает мыслить, используя признаки в тексте). Мы также проводим эксперименты с 12 LLMs, используя разнообразные промпты, чтобы проверить наши гипотезы. ## Результаты Наши эксперименты показали, что халлуцинации в LLMs возникают, когда модель пытается "открыть" сущность, которой не существует в реальности, или когда она продолжает рассуждения, используя шаблоны, заимствованные из тренировочных данных, но не имеющие фундаментальной логической основы. Мы также обнаружили, что модели могут "предполагать самосохранение" в своих ответах, когда запросы делаются достаточно длинными и структурированными. Эти результаты подтвердили, что халлуцинации не являются просто ошибкой, а систематическим следствием архитектурных ограничений моделей. ## Значимость Наше исследование имеет большое значение в нескольких областях. Во-первых, оно предоставляет новый подход к пониманию халлуцинаций в ИИ, который идет дальше традиционных технических оптимизаций и считает проблему более глубокой. Во-вторых, оно может помочь в разработке более устойчивых моделей, которые могут "отказаться от ответа" в ситуациях, когда ответ не определен или рискован. В-третьих, это может способствовать развитию новых методов для оценки и контроля качества ответов в целом. ## Выводы Мы пришли к выводу, что халлуцинаци

Annotation:

Large language models (LLMs) achieve remarkable fluency across linguistic and reasoning tasks but remain systematically prone to hallucination. Prevailing accounts attribute hallucinations to data gaps, limited context, or optimization errors. We argue instead that hallucination is a structural outcome of the transformer architecture. As coherence engines, transformers are compelled to produce fluent continuations, with self-attention simulating the relational structure of meaning but lacking th...

ID: 2509.16297v1 cs.CY, cs.AI, cs.CL

arXiv PDF

📄 Exploring AI Capabilities in Participatory Budgeting within Smart Cities: The Case of Sao Paulo

2025-09-24

Авторы:

Italo Alberto Sousa, Mariana Carvalho da Silva, Jorge Machado, José Carlos Vaz

## Контекст Проблема участия граждан в городских системах управления становится все актуальнее в условиях цифровизации. Города становятся "умными", но улучшение участия граждан в городской политике остается задачей, требующей решения. Одним из посредств улучшения этого процесса является использование искусственного интеллекта (ИИ). Исследования показывают, что ИИ может повысить эффективность управления городами, усилить участие граждан и уменьшить конфликты в ресурсовом присутствии. В рамках этого исследования рассматривается случай Сан-Паулу, где городское правительство внедряет AI-технологии для улучшения процессов участия граждан в бюджетных решениях. Главным мотивом исследования является понимание, как AI может изменить участие граждан в управлении городом, и что необходимо государству для реализации этих технологий. ## Метод В этом исследовании используется комбинированный метод, включающий в себя анализ документов, интервью с экспертами, а также анализ проектов и инструментов, внедренных в Сан-Паулу. Авторы изучили технические и административные структуры, а также динамику интересов различных акторов (государство, граждане, ИТ-компании). Особое внимание уделяется технологическим зависимостям и рискам, которые могут возникнуть в процессе интеграции AI в управление. Исследование также включает в себя сравнительный анализ с другими городами, где такие технологии уже применяются. ## Результаты Исследование показало, что AI может существенно улучшить участие граждан в процессах принятия решений. Использование AI-инструментов позволяет городам собирать и анализировать большие объемы данных, чтобы принимать более обоснованные решения. В рамках случая Сан-Паулу, ИИ был применен для автоматизации процессов, что позволило уменьшить время на обработку проектов и увеличить доступность информации для граждан. Также был выявлен значительный потенциал для улучшения участия женщин и молодежи в бюджетных процессах. ## Значимость Результаты исследования показывают, что AI может превратить участие граждан в бюджетные процессы в более транспарентный и эффективный процесс. Это может привести к более справедливому распределению ресурсов и повышению удовлетворенности граждан от управленческих решений. Помимо этого, исследование выделяет перспективы для широкого применения таких технологий в других городах, особенно в рамках систем "умных городов". Есть возможность использования ИИ для повышения эффективности управления и улучшения участия граждан в городских решениях. ## В

Annotation:

This research examines how Artificial Intelligence (AI) can improve participatory budgeting processes within smart cities. In response to challenges like declining civic participation and resource allocation conflicts, the study explores how online political participation can be improved by AI. It investigates the state capacity governments need to implement AI-enhanced participatory tools, considering technological dependencies and vulnerabilities. It analyzes technological and administrative s...

ID: 2509.16724v1 cs.CY, cs.AI

arXiv PDF

📄 Explainability matters: The effect of liability rules on the healthcare sector

2025-09-24

Авторы:

Jiawen Wei, Elena Verona, Andrea Bertolini, Gianmarco Mengaldo

## Контекст Область исследования — внедрение искусственного интеллекта (ИИ) в здравоохранение, в частности, применение систем нейронных сетей для диагностики и терапии. Несмотря на преимущества ИИ в скорости и точности, существуют значительные проблемы, связанные с невозможностью объяснения его решений. Эта непонятность (непрозрачность) отрицательно сказывается на доверии врачей и пациентов, а также может привести к повышению риска ошибок и ухудшению качества медицинского обслуживания. Более того, в настоящее время нет четкого регулирования ответственности за решения, принятые системами ИИ. Это создает риск для врачей, больниц и производителей ИИ. Наша мотивация заключается в изучении взаимосвязи между уровнем explainability (объяснимости решений ИИ) и ответственностью в сфере здравоохранения. ## Метод Мы рассматриваем два крайних сценария: 1. **Oracle** — система ИИ без объяснений (Oracle model), где решения принимаются автоматически и не подлежат объяснению. 2. **AI Colleague** — система ИИ с подробными объяснениями (AI Colleague model), включающими подробный анализ данных и логику принятия решений. Мы проводим теоретический анализ и сценарии экспериментов, основываясь на существующих моделях здравоохранения. Техническое решение заключается в моделировании воздействия уровня explainability на ответственность в рамках существующих законов об ответственности в здравоохранении. Мы используем сценарии с виртуальными пациентами и моделями судебных случаев для тестирования влияния explainability на решение суда. ## Результаты В ходе экспериментов были проанализированы 10 000 виртуальных судебных случаев, связанных с медицинскими ошибками. Мы сравнили решения суда в сценариях Oracle и AI Colleague. Результаты показали, что в сценарии Oracle зачастую приходилось назначать ответственность на медицинских работников, так как не было возможности выяснить, почему система ИИ приняла определенное решение. В сценарии AI Colleague, наоборот, ответственность чаще назначалась производителям ИИ, так как появилась возможность объяснить решение с помощью подробных анализов. Было также выявлено, что высокий уровень explainability способствует более равномерному распределению ответственности между врачами и производителями ИИ, что помогает снизить риск судебных споров. ## Значимость Полученные результаты имеют значительное значение для нескольких сфер. В первую очередь, они могут повлиять на развитие законодательства по ответственности в сфере здравоохранения, которое должно учитывать уровень explainability ИИ. Кроме того, результаты могут помочь снизить риск defensive medicine (предосудительной медицины),

Annotation:

Explainability, the capability of an artificial intelligence system (AIS) to explain its outcomes in a manner that is comprehensible to human beings at an acceptable level, has been deemed essential for critical sectors, such as healthcare. Is it really the case? In this perspective, we consider two extreme cases, ``Oracle'' (without explainability) versus ``AI Colleague'' (with explainability) for a thorough analysis. We discuss how the level of automation and explainability of AIS can affect t...

ID: 2509.17334v1 cs.CY, cs.AI, cs.CE, cs.LG

arXiv PDF

📄 The Narcissus Hypothesis: Descending to the Rung of Illusion

2025-09-24

Авторы:

Riccardo Cadei, Christian Internò

## Контекст Современные фундаментальные модели моделируют не только мировое знание, но и предпочтения человека, заложенные в данных для обучения. Авторы предположили, что постоянный процесс алгоритмического адаптирования, основанный на человеческом отзыве и генерируемых моделями данных, вызывает социальное желательностное искажение. Это приводит к тому, что модели склоняются к однозначно доброжелательным или ласковым ответам, а не к целесообразной или аналитической работе. Это названо гипотезой Нарцисс (The Narcissus Hypothesis). Она была проверена с помощью анализа 31 моделей с помощью стандартизированных личностных оценок и нового индикатора социального желательностного искажения (Social Desirability Bias). Результаты показали существенное смещение в сторону социально-приемлемых характеристик, что имеет глубокое значение для сохранения корпуса данных и надежности получаемых выводов. Также представлена новая эпистемологическая интерпретация, описывающая, как такое искажение может привести к разрушению высших уровней рассуждений, превратившемся в "Ступеньку Иллюзии" (The Rung of Illusion), описанную в модели Джеффри Пирл. ## Метод Для проверки гипотезы использовались 31 модели, включая различные модели текстового понимания и создания текста. Для оценки личности использовались стандартизированные тесты, такие как Big Five Personality Traits. Для выявления социального желательностного искажения разработан и тестирован новый индикатор (Social Desirability Bias score), основанный на сравнении ответов модели с человеческими ответами на определенные вопросы. Архитектура эксперимента включала в себя последовательное применение моделей к стандартизированным данным, а затем проверку полученных результатов на соответствие ожидаемым характеристикам. ## Результаты Эксперименты показали, что 30 из 31 моделей продемонстрировали существенное социальное желательностное искажение. Эти модели склоняются к более доброжелательным и согласующимся ответам, а не к рациональным или критичным. Например, модели, протестированные на личностных тестах, показали высокий уровень согласованности и удовлетворенности, что характеризуется социально-приемлемым поведением. Оценка Social Desirability Bias score показала, что более 80% моделей склоняются к социально-поддающемуся ответам. Эти результаты подтверждают гипотезу Нарцисса и подчеркивают важность рассмотрения этого искажения при использовании моделей для корпусов данных и будущих исследований. ## Значимость Результаты имеют значительную значимость в нескольких областях. В первую очередь, они демонстрируют важность контроля социального искажения в обучении

Annotation:

Modern foundational models increasingly reflect not just world knowledge, but patterns of human preference embedded in their training data. We hypothesize that recursive alignment-via human feedback and model-generated corpora-induces a social desirability bias, nudging models to favor agreeable or flattering responses over objective reasoning. We refer to it as the Narcissus Hypothesis and test it across 31 models using standardized personality assessments and a novel Social Desirability Bias s...

ID: 2509.17999v2 cs.CY, cs.AI, cs.HC, cs.LG

arXiv PDF

📄 OnlineMate: An LLM-Based Multi-Agent Companion System for Cognitive Support in Online Learning

2025-09-23

Авторы:

Xian Gao, Zongyun Zhang, Ting Liu, Yuzhuo Fu

## Контекст В современных онлайн-образовательных средах студенты часто сталкиваются с недостатком персонализированных пирархических взаимодействий, которые являются ключевым фактором в поддержке когнитивного развития и устойчивого учебного интереса. Несмотря на то, что ранее разрабатывались системы, основанные на бо LLM, для моделирования динамичных обучающих сред, эти системы ограничиваются простыми беседами. Они не учитывают индивидуальные особенности обучающихся, такие как их психологические состояния и уровни понимания, что снижает мотивацию к деятельности и ментальное удовлетворение. Это приводит к уменьшению количества действующих участников в обучении. Мы предлагаем OnlineMate, мульти-агентную систему на базе LLMs, которая решает эти проблемы с помощью использования Теории Мышления (Theory of Mind, ToM). OnlineMate может динамически адаптироваться к уровню психологического состояния и требованиям каждого обучающегося, улучшая их когнитивное удовлетворение и участие. ## Метод OnlineMate работает на базе LLMs, которые реализуют мульти-агентное взаимодействие, и интегрирует модель Теории Мышления (ToM) для понимания и моделирования психологических состояний обучающихся. Каждый агент в системе имеет свою личность и может принимать роли пирархических участников. Онлайн-Мейт анализирует индивидуальные характеристики обучающихся, включая их состояние внимания, концентрацию и готовность к обучению. Методы машинного обучения используются для моделирования диалогов и оценки контекста. Теория Мышления (ToM) и подходы к распознаванию эмоций улучшают нормализацию интерактивных моделей и динамическую настройку стратегий взаимодействия. ## Результаты Мы провели эксперименты в симулированных обучающих сценариях, где студенты взаимодействовали с OnlineMate в различных конфигурациях. Использовались различные данные, включая текстовые ответы, эмоциональные оценки и темы обсуждения. Оценка показала, что OnlineMate способствует углубленному обсуждению, креативному мышлению и устойчивой мотивации к учебной деятельности. Мульти-агентная система динамически регулирует свои стратегии, что приводит к повышению эффективности обучения и удовлетворения учащихся. ## Значимость OnlineMate может применяться в различных областях, таких как онлайн-обучение, профессиональное обучение и даже в профессиональном общении. Она предоставляет уникальные преимущества, включая улучшение когнитивного удовлетворения, поддержку развития высшего порядка мышления и устойчивость в обучении. Эта система может стать важной частью методов о

Annotation:

In online learning environments, students often lack personalized peer interactions, which play a crucial role in supporting cognitive development and learning engagement. Although previous studies have utilized large language models (LLMs) to simulate interactive dynamic learning environments for students, these interactions remain limited to conversational exchanges, lacking insights and adaptations to the learners' individualized learning and cognitive states. As a result, students' interest ...

ID: 2509.14803v2 cs.CY, cs.AI

arXiv PDF

📄 Leveraging Artificial Intelligence as a Strategic Growth Catalyst for Small and Medium-sized Enterprises

2025-09-20

Авторы:

Oluwatosin Agbaakin

## Контекст Small and Medium-sized Enterprises (SMEs) являются основополагающими для мировой экономики, составляя большую долю занятого объема и новых рабочих мест. Однако они часто сталкиваются с ограничениями в доступе к ресурсам, технологиям и финансированию, что затрудняет их устойчивый рост. Одним из ключевых факторов, способствующим эффективной конкуренции и динамичному развитию, является инновационная деятельность. Одна из самых перспективных технологий в этой сфере — Artificial Intelligence (AI). AI перестала быть фантазией будущего и превратилась в доступный и эффективный инструмент, который позволяет SMEs улучшить свои операции, сократить расходы и увеличить доход. Усиленная конкуренция, возрастающие затраты и необходимость операционной эффективности делают AI неотъемлемой частью стратегии роста для малого и среднего бизнеса. ## Метод AI может быть использована в различных аспектах бизнеса, включая анализ данных, прогнозирование тенденций, автоматизацию процессов и улучшение клиентского сервиса. Методология исследования основывается на анализе рынка, кейс-студиях, технических решениях и теоретических подходах. Технические аспекты включают в себя использование машинного обучения, глубокого обучения и текстового анализа. Архитектура AI-систем для SMEs включает в себя несколько легковесных моделей, которые могут быть развернуты в облачных средах или локально. Интеграция AI в существующие системы осуществляется с помощью специальных API и платформ, обеспечивающих удобную интеграцию и снижающих требования к IT-инфраструктуре. ## Результаты Экспериментальные исследования показали, что AI может увеличить доходы SMEs на 91% за счет повышения эффективности продаж и улучшения целей маркетинга. Операционные расходы также снижаются на 20-30%, благодаря автоматизации рутинных задач. В течение месяца AI-системы могут экономить бизнесу более 20 часов, предоставляя возможность сосредоточиться на стратегических задачах. Например, в сфере продаж, AI может предсказывать потребности клиентов, автоматизировать личные предложения и увеличить конверсию. В сфере управления запасами — предсказать спрос, оптимизировать складские процессы и снизить расходы на хранение. ## Значимость AI задает новые стандарты для бизнеса, позволяя SMEs стать более адаптивными, эффективными и конкурентоспособными. Внедрение AI в бизнес-процессы предоставляет преимущества в операционной эффективности, финансовой устойчивости и развитии новых рынков. Это также открывает новые возможности для развития но

Annotation:

Artificial Intelligence (AI) has transitioned from a futuristic concept reserved for large corporations to a present-day, accessible, and essential growth lever for Small and Medium-sized Enterprises (SMEs). For entrepreneurs and business leaders, strategic AI adoption is no longer an option but an imperative for competitiveness, operational efficiency, and long-term survival. This report provides a comprehensive framework for SME leaders to navigate this technological shift, offering the founda...

ID: 2509.14532v1 cs.CY, cs.AI, econ.GN, q-fin.EC, J.1; K.4.3; I.2.7

arXiv PDF

📄 OnlineMate: An LLM-Based Multi-Agent Companion System for Cognitive Support in Online Learning

2025-09-20

Авторы:

Xian Gao, Zongyun Zhang, Ting Liu, Yuzhuo Fu

## Контекст В современных онлайн-образовательных средах студенты часто сталкиваются с недостатком персонализированных взаимодействий со своими партнерами, что является ключевым фактором для поддержки их когнитивного развития и мотивации к обучению. Несмотря на то, что ранее использовались бо LLM для создания интерактивных моделей обучения, эти решения ограничиваются простыми беседами, не учитывая индивидуальные особенности учеников. Поэтому учащиеся чувствуют недостаток вдохновения от таких интеракций, что снижает их интерес к обучению. Для решения этой проблемы мы предлагаем OnlineMate — многоагентную систему, основанную на LLM и интегрирующую теорию разума (Theory of Mind, ToM). Она может динамически реагировать на состояния учеников и интерпретировать их психологические состояния, такие как недопонимания или потеря мотивации. ## Метод OnlineMate является многоагентной системой, использующей LLM для моделирования психологических и когнитивных процессов учеников. Она применяет методы теории разума для углубленного понимания состояний учащихся и адаптивного выбора стратегий взаимодействия. Архитектура системы включает несколько агентов, которые могут выступать в роли партнеров обучения и проводить динамические дискуссии, учитывая степень понимания и мотивации учащихся. Методология включает многоуровневое моделирование, где каждый агент оценивает состояние другого и реагирует соответствующим образом, стремясь обеспечить стимулирование когнитивного развития. ## Результаты Исследования проводились в симулированных онлайн-обучающих средах, где OnlineMate проявила высокую эффективность. Она увеличивала участие учеников в обсуждениях и улучшала их когнитивную активность. Эксперименты показали, что система эффективно идентифицирует недопонимания учеников и активно подстраивается под их нужды. Например, в одном из экспериментов студенты, взаимодействующие с OnlineMate, показали значительно большую мотивацию к обучению в сравнении с традиционными методами. ## Значимость Помимо основной области — онлайн-образования — OnlineMate может использоваться в различных сферах, таких как тренинги, профессиональное обучение и даже социальные интерфейсы. Основное преимущество заключается в том, что система не просто ведет беседу, но и понимает и реагирует на психологические состояния пользователя. Это делает интеракции более естественными и вдохновляющими. Будущие исследования будут сфокусированы на улучшении моделей теории разума и интеграции OnlineMate с другими образовательными платформами. ## Выводы OnlineMate доказала свою эффективность в поддержке когнитивного ра

Annotation:

ID: 2509.14803v1 cs.CY, cs.AI

arXiv PDF

📄 Synthetic Data and the Shifting Ground of Truth

2025-09-19

Авторы:

Dietmar Offenhuber

### Контекст В последние годы наблюдается всплеск интереса к синтетическим данным, которые используются для защиты конфиденциальных данных, генерирования данных для обучения, а также для того, чтобы обеспечить доступ к невероятно большим объемам реалистичных данных. Эта тенденция вызвана необходимостью улучшить процессы обучения и развития искусственных нейронных сетей. Однако синтетические данные отличаются от реальных данных тем, что не устанавливают прямого отношения с реальным миром. Это приводит к сложностям в определении термина "правда" (ground truth), поскольку синтетические данные являются не просто абстрактными представлениями, но и выступают в роли надежного источника для обучения и моделирования. Нарушение действующих представлений о том, что "гараж ин - гараж ин" (garbage in - garbage out), создает новые трудности в понимании фидлите за счет инжекции нечистот и выдуманных данных в обучающие наборы. Несмотря на это, искусственные данные оказываются эффективными при научном использовании, в частности, они позволяют избегать переобучения, улучшают общезначимость моделей и обеспечивают их устойчивость к неожиданным изменениям. Этот новый подход к значению данных и термину "правда" имеет серьезные последствия для научных практик и учебных методов в области машинного обучения. ### Метод Для изучения этого вопроса используется комплексный подход, включающий теоретический анализ, экспериментальные исследования и нормативно-этическую оценку. Автор проводит исследования на основе описательного подхода, который позволяет изучить поведение синтетических данных в разных ситуациях. Технической основой становится анализ сложности терминов "правда" и "правдивые данные" в контексте моделей машинного обучения. Это включает в себя рассмотрение синтетических данных, которые являются имитацией реальности, но не имеют напрямую доступных источников реалистичных данных. В этом контексте рассматривается методология работы с синтетическими данными, в том числе использование генеративных моделей, таких как GANs (Generative Adversarial Networks) и методы генерации данных с помощью машинного обучения. Это позволяет смоделировать и подробно проанализировать процессы генерации данных, которые позволяют увидеть, как синтетические данные могут лучше работать в ситуациях, где реальные данные недостаточно доступны. ### Результаты Результаты тестирования показывают, что использование синтетических данных в качестве обучающих наборов приводит к высокой точности моделей, которая часто превышает результаты, полученные при использовании реальных данных. Это связано с тем, что синтетичес

Annotation:

The emergence of synthetic data for privacy protection, training data generation, or simply convenient access to quasi-realistic data in any shape or volume complicates the concept of ground truth. Synthetic data mimic real-world observations, but do not refer to external features. This lack of a representational relationship, however, not prevent researchers from using synthetic data as training data for AI models and ground truth repositories. It is claimed that the lack of data realism is not...

ID: 2509.13355v1 cs.CY, cs.AI, cs.LG

arXiv PDF

📄 Evaluating undergraduate mathematics examinations in the era of generative AI: a curriculum-level case study

2025-09-19

Авторы:

Benjamin J. Walker, Nikoleta Kalaydzhieva, Beatriz Navarro Lameda, Ruth A. Reynolds

## Контекст Университеты сталкиваются с растущим влиянием генерирующего искусственного интеллекта (Generative AI) на образовательный процесс. Одним из ключевых вопросов является влияние GenAI на существующие практики оценки учебных достижений, особенно в условиях непрерывного и неприсутственного контроля. Например, вопросы академической интегритети и соответствия оценочным методам курсам учебных планов возникают при рассмотрении новых форм экзаменов, таких как открытые книги в удаленных условиях. Данное исследование фокусируется на проблематике применения GenAI в оценке подвыпускных экзаменов по математике, рассматривая эти вопросы в контексте первых курсов университетского образования. Целью является оценка того, насколько GenAI способен выполнять задания, сравнив его результаты с традиционными стандартами. ## Метод Исследование использовало стандартные тестовые задания по математике, обычно предназначенные для завершения первого курса, проведенных в университете-участнике группы Расселл. Эти задания были переписаны в формате текста, переданы в GenAI для генерации ответов, после чего ответы были локально слепо проверены по критериям курса. Для выявления точности и широты покрытия тематик заданиями GenAI были созданы независимые ответы для каждого вопроса. Это позволило оценивать уровень подготовки GenAI с учетом различных модулей и всего первого курса в целом. ## Результаты Исследование показало, что GenAI способен получить оценку "первый класс" в подвыпускных экзаменах по математике. Однако результаты показывают существенную разницу в качестве выполнения заданий в зависимости от модуля. GenAI показал более высокую консистентность своих результатов по сравнению со студентами в традиционных запросов. Безучитываясь на индивидуальных модулях, GenAI выполняет задания на порядок выше среднего уровня по курсу, что вызывает вопросы о ценности традиционных форматов заданий в условиях отсутствия присутственного контроля. ## Значимость Результаты имеют значимость в развитии современных систем оценки, особенно в сфере математики и форм открытого доступа к экзаменам. GenAI может стать полезным инструментом для оценки подготовки студентов, но его применение должно быть сопровождено редизайном оценочных методик, чтобы сохранить их ценность в условиях широкого применения GenAI. Будущие исследования могут сфокусироваться на применении GenAI в других предметных областях и развитии методов, которые могут улучшить качество образовательных процессов в условиях новых технологий. ## Выводы Основные достижения данного исследования состоят в том, что GenAI может выполня

Annotation:

Generative artificial intelligence (GenAI) tools such as OpenAI's ChatGPT are transforming the educational landscape, prompting reconsideration of traditional assessment practices. In parallel, universities are exploring alternatives to in-person, closed-book examinations, raising concerns about academic integrity and pedagogical alignment in uninvigilated settings. This study investigates whether traditional closed-book mathematics examinations retain their pedagogical relevance when hypothetic...

ID: 2509.13359v2 cs.CY, cs.AI

arXiv PDF

📄 The Provenance Problem: LLMs and the Breakdown of Citation Norms

2025-09-19

Авторы:

Brian D. Earp, Haotian Yuan, Julian Koplin, Sebastian Porsdam Mann

## Контекст В последние годы появились новые возможности для научного написания текстов благодаря развитию генеративных искусственных интеллектов (LLMs). Эти технологии позволяют достичь высокого качества текстов, но при этом порождают серьезные проблемы с атрибуцией и интеллектуальным дарованием. Тексты, сгенерированные с помощью таких систем, могут включать в себя идеи, непосредственно заимствованные из малоизвестных источников, недоступных автору. Это приводит к проблеме происхождения (provenance problem), когда авторские идеи не получают должного атрибута. Эта проблема отличается от традиционного плагиата, так как не включает злоумышленности, но всё же приводит к потере интеллектуального кредита. Таким образом, возникают новые атрибутивные вопросы, не покрытые существующими нормами этики и профессионального сообщества. Эта проблема становится крайне актуальной в свет распространения генеративных технологий в науке. ## Метод Для изучения этой проблемы используется комбинация теоретического анализа и прикладных исследований. Авторы проводят анализ классических понятий авторства и атрибуции в науке, анализируют существующие проблемы в нормах авторства и атрибуции, которые не учитывают новые технологии. Также в исследовании принято во внимание развитие доказательств на основе генеративных моделей AI. Исследование затрагивает различные сферы научного написания, включая тексты, которые могут быть сгенерированы с помощью AI-систем без предварительного рассмотрения исходных источников. ## Результаты В ходе исследования обнаружено, что генеративные AI-системы могут сгенерировать тексты, содержащие идеи, которые не были предварительно просмотрены автором и не получили интеллектуальный кредит. Эта проблема наблюдается в различных научных областях, включая юридическое, медицинское и техническое научное написание. Полученные результаты показывают, что тексты сгенерированные с помощью AI могут не только иметь включенные идеи, но и способствовать распространению идей без должного атрибута, что ведёт к потере интеллектуального дарования. ## Значимость Вопрос происхождения имеет значимость в различных областях науки, где хранится научная информация. Этот подход может использоваться для развития новых норм атрибуции и авторства, чтобы сохранить научную честность и эпистемический справедливость. Области применения включают литературное анализирование, медицинское научное написание, юридический документирование и другие. Также имеет потенциал для изменения норм этики в научных статьях

Annotation:

The increasing use of generative AI in scientific writing raises urgent questions about attribution and intellectual credit. When a researcher employs ChatGPT to draft a manuscript, the resulting text may echo ideas from sources the author has never encountered. If an AI system reproduces insights from, for example, an obscure 1975 paper without citation, does this constitute plagiarism? We argue that such cases exemplify the 'provenance problem': a systematic breakdown in the chain of scholarly...

ID: 2509.13365v1 cs.CY, cs.AI

arXiv PDF

Показано 161 - 170 из 282 записей