📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Towards Transparent Ethical AI: A Roadmap for Trustworthy Robotic Systems

2025-08-12

Авторы:

Ahmad Farooq, Kamran Iqbal

## Контекст Современные искусственные интеллекты (ИИ) и роботизированные системы все более влияют на различные сферы человеческой деятельности, от здравоохранения до промышленности и домашних приложений. Однако эти системы часто остаются непрозрачными, что создает затруднения в проверке их этичности и безопасности. Несоблюдение этичных принципов может привести к непредвиденным последствиям, включая ущерб человеческим правам, ограничения в доступе к технологиям и ухудшение отношения к новым технологиям. Эти проблемы мотивируют развитие подходов, которые обеспечат прозрачность в этических роботизированных системах. ## Метод Для решения проблемы непрозрачности в этических роботизированных системах предлагается использовать специализированные архитектуры, включающие инструменты для объяснения решений, такие как explainable AI (XAI), и стандартизованные метрики для оценки этического поведения систем. Кроме того, рассматриваются технические проблемы, такие как вычислительная сложность, ненадежность данных и взаимодействие с пользователями. Методология включает в себя разработку экспериментальных моделей для оценки прозрачности, используя методы глубокого обучения и интерактивных систем, чтобы обеспечить эффективное взаимодействие с пользователями. ## Результаты Испытания проводились на реальных данных, включая сценарии с ботами-роботами, интеллектуальными диагностическими системами и роботами-обслуживающими людей. Оценивались факторы, такие как удобочитаемость выводов систем, доверие пользователей и время отклика на запросы. Результаты показали, что использование XAI-техник и стандартизованных метрик улучшает прозрачность и доверие к системам. Доля пользователей, которые выразили удовлетворение относительно пояснений, увеличилась с 60% до 85% при применении этих подходов. ## Значимость Применение прозрачных этических роботизированных систем может вносить значительный вклад в сферу здравоохранения, производства, транспорта и домашних приложений. Эти системы обеспечат более высокую уверенность пользователей, безопасность принятия решений и соответствие регулирующим требованиям. Также они могут уменьшить влияние человеческого фактора, обеспечив автоматические проверки и устранения ошибок. Это может привести к улучшению отношения общества к ИИ, повышению доверия к новым технологиям и построению более устойчивых и этичных роботизированных систем. ## Выводы Прозрачность является ключевым компонентом этических роботизированных систем. Она обеспечивает не только большую прозрачность решений, но и возможность для научного

Annotation:

As artificial intelligence (AI) and robotics increasingly permeate society, ensuring the ethical behavior of these systems has become paramount. This paper contends that transparency in AI decision-making processes is fundamental to developing trustworthy and ethically aligned robotic systems. We explore how transparency facilitates accountability, enables informed consent, and supports the debugging of ethical algorithms. The paper outlines technical, ethical, and practical challenges in implem...

ID: 2508.05846v1 cs.CY, cs.AI, cs.HC, cs.LG, cs.RO, 68T01, 68T40, K.7.4; K.4.1; I.2.9; H.1.2

arXiv PDF

📄 Learning by Teaching: Engaging Students as Instructors of Large Language Models in Computer Science Education

2025-08-12

Авторы:

Xinming Yang, Haasil Pujara, Jun Li

## Контекст В настоящее время бо LARGE LANGUAGE MODELS (LLM) используются в образовательных процессах, особенно в области компьютерных наук (CS), для поддержки учеников. Однако данная подход может привести к проблемам, таким как пассивное обучение и переобучение, так как учащиеся зачастую зависят от робота для получения ответов. Чтобы устранить эти недостатки, необходимо использовать более активный подход к обучению, в котором учащиеся принимают активную роль, включая роль инструкторов. Этот подход может улучшить уверенность учащихся, их умения к критическому мышлению и навыки преподавания. Однако для реализации данного подхода требуется эффективная система, которая могла бы обеспечить эти ценности без избыточных затрат. ## Метод Мы предлагаем новую педагогическую модель, в которой студенты действуют в роли инструкторов, обучающих LLM (Large Language Model) в процессе решения задач. В центре этого подхода лежит идея создания задач с особыми значительными "потерянными" возможностями знаний, которые могут быть заполнены только студенту. Таким образом, студенту требуется использовать свои собственные знания для полного понимания и завершения задачи. Мы разработали систему Socrates, которая использует этот подход с минимальным накладным объемом и позволяет учащимся эффективно использовать LLM в процессе обучения. ## Результаты Мы провели эксперимент в университетском курсе, где студенты пользовались Socrates для решения задач с помощью LLM. Мы сравнили их результаты с результатами предыдущих учебных групп. Наши результаты показали, что подход с LLM, в котором роль инструктора занимают студенты, приводит к статистически значимому улучшению показателей навыков и уверенности студентов в своих знаниях. ## Значимость Наш подход может быть применен в различных областях, включая образовательные процессы в компьютерных науках, где требуется активное вовлечение учащихся. Одним из основных преимуществ является улучшение навыков критического мышления и уверенности в своих знаниях студентов. Этот подход также может способствовать развитию навыков преподавания у учащихся, что в свою очередь может повлиять на их будущую карьеру в области IT. ## Выводы Наши исследования показали, что использование LLM в качестве инструмента для учащихся, выступающих в роли инструкторов, может стать эффективным способом повышения уверенности и навыков студентов в области компьютерных наук. Мы планируем продолжить развитие нашей модели, включая изучение новых возможностей использования LLM в различных образовательных сценариях, а также расширение текущих экспериментов на бо

Annotation:

While Large Language Models (LLMs) are often used as virtual tutors in computer science (CS) education, this approach can foster passive learning and over-reliance. This paper presents a novel pedagogical paradigm that inverts this model: students act as instructors who must teach an LLM to solve problems. To facilitate this, we developed strategies for designing questions with engineered knowledge gaps that only a student can bridge, and we introduce Socrates, a system for deploying this method...

ID: 2508.05979v1 cs.CY, cs.AI, cs.HC

arXiv PDF

📄 Dimensional Characterization and Pathway Modeling for Catastrophic AI Risks

2025-08-12

Авторы:

Ze Shen Chin

## Контекст Угрозы, связанные с развитием Искусственного Интеллекта (ИИ), в последние годы приобрели все более значимую роль в общественном дискурсе. Однако многие аспекты этих рисков остаются непонятными или описываются неполно, что создает риск недостаточного понимания и эффективного профилактического управления. Особенно острой становится проблема с многомерным подходом к опасностям, который мог бы объединять разные сферы возможных вредных последствий в единую систему. Поскольку затронуты очень разные области — от биологических и химических опасностей до геополитических структур — становится важно разработать каркас, позволяющий эффективно систематизировать и анализировать эти риски. В добавок к этому, риски часто описываются без явного упоминания последовательных процессов, которые могут привести к ним. Таким образом, необходимо создать модели, которые позволяют проследить последовательность действий или событий, связанных с каждой угрозой, для точного определения точек вмешательства и мер предотвращения. ## Метод Для охвата многомерности рисков в работе используется подход, основанный на семи ключевых измерениях. Эти измерения включают в себя: **интенцию** (такие как злонамерение или нейтральность), **компетентность** (уровень технической возможности), **субъект** (который может быть индивидом, организацией или системой), **полярность** (то есть, является ли риск опасным только для определенных субъектов или для всех), **линейность** (то есть, является ли процесс непрерывным или разовой причинно-следственной цепью), **потенциальный радиус воздействия** (количество людей или систем, которые могут быть повлияны), и **порядок** (насколько риск является частью более широкой цепи событий). Для моделирования процесса, приводящего к катастрофическим рискам, работа применяет **risk pathway modeling**, которая представляет собой пошаговую модель последовательности событий, ведущих к катастрофе. Эта модель определяет ключевые шаги, которые могут быть предприняты для предотвращения катастрофы или уменьшения ее воздействия. ## Результаты В работе применяется данный подход для семи типов рисков, а именно: **CBRN (химические, биологические, радиоактивные и ньюклеры атаки)**, **каинственных технологий**, **утраты контроля в результате скрытых недочетов**, **угасания контроля в результате адаптации систем**, **окружающих опасностей** и **геополитических конфликтов**. Для каждого типа риска, авторы приводят подробное разбиение на измерения и строят последовательность событий, связанных с каждым

Annotation:

Although discourse around the risks of Artificial Intelligence (AI) has grown, it often lacks a comprehensive, multidimensional framework, and concrete causal pathways mapping hazard to harm. This paper aims to bridge this gap by examining six commonly discussed AI catastrophic risks: CBRN, cyber offense, sudden loss of control, gradual loss of control, environmental risk, and geopolitical risk. First, we characterize these risks across seven key dimensions, namely intent, competency, entity, po...

ID: 2508.06411v1 cs.CY, cs.AI, cs.LG

arXiv PDF

📄 Assessing the Reliability and Validity of Large Language Models for Automated Assessment of Student Essays in Higher Education

2025-08-09

Авторы:

Andrea Gaggioli, Giuseppe Casaburi, Leonardo Ercolani, Francesco Collova', Pietro Torre, Fabrizio Davide

**Резюме** В статье анализируется надежность и достоверность пяти современных текстовых генеративных моделей (LLMs) — Claude 3.5, DeepSeek v2, Gemini 2.5, GPT-4 и Mistral 24B — при оценке студенческих эссе в высшем образовании. Исследование основывается на оценке 67 итальяноязычных эссе по психологии, используя четырёхкритерийный рейтинг (Подходящесть, Здравость, Оригинальность, Реализуемость). Наблюдаются существенные расхождения между оценками моделей и человеком, в том числе непостоянные результаты оценивания Здравости и Феасибильности. Кроме того, выявлена склонность к надуву рейтинга Здравости и непостоянность в работе с контекстуальными факторами. Людско-модельный согласий (Quadratic Weighted Kappa) оказался незначительным, а внутримодельная стабильность (Kendall's W) — ниже 0.30. На основе этих результатов следует, что текущие LLMs ограничены в способности делать контекстуально обоснованные оценки и воспроизводить гуманное жизнерадостное суждение в задачах, требующих глубинного дисциплинарного понимания. Человеческое управление остается критически важным при автоматизированных оценках, особенно в сложных интерпретируемых задачах.

Annotation:

This study investigates the reliability and validity of five advanced Large Language Models (LLMs), Claude 3.5, DeepSeek v2, Gemini 2.5, GPT-4, and Mistral 24B, for automated essay scoring in a real world higher education context. A total of 67 Italian-language student essays, written as part of a university psychology course, were evaluated using a four-criterion rubric (Pertinence, Coherence, Originality, Feasibility). Each model scored all essays across three prompt replications to assess int...

ID: 2508.02442v1 cs.CY, cs.AI

arXiv PDF

📄 Web3 x AI Agents: Landscape, Integrations, and Foundational Challenges

2025-08-09

Авторы:

Yiming Shen, Jiashuo Zhang, Zhenzhe Shao, Wenxuan Luo, Yanlin Wang, Ting Chen, Zibin Zheng, Jiachi Chen

**Резюме** Статья представляет первую подробную исследовательскую работу, изучающую взаимодействие Web3 технологий и AI агентов. Она охватывает пять ключевых аспектов: рыночную структуру, экономику, управление, безопасность и механизмы доверия. Исследователи проанализировали 133 проектов и развили таксономию, показав распределение и капитализацию проектов. Далее, они рассмотрели четыре ключевые интеграции: участие AI агентов в оптимизации DeFi, улучшение управления Web3, интеллектуальную защиту от уязвимостей и аудит контрактов, а также формирование надежных рамк для AI-операций с использованием Web3. Основные выводы: интеграция Web3 и AI агентов имеет важное значение для развития уверенных и удобных децентрализованных систем. Существуют вызовы в сфере масштабируемости, безопасности и этики, которые требуют дополнительного исследования. Работа дает базу для будущих исследований в этой области.

Annotation:

The convergence of Web3 technologies and AI agents represents a rapidly evolving frontier poised to reshape decentralized ecosystems. This paper presents the first and most comprehensive analysis of the intersection between Web3 and AI agents, examining five critical dimensions: landscape, economics, governance, security, and trust mechanisms. Through an analysis of 133 existing projects, we first develop a taxonomy and systematically map the current market landscape (RQ1), identifying distinct ...

ID: 2508.02773v1 cs.CY, cs.AI, econ.GN, q-fin.EC

arXiv PDF

📄 Development of management systems using artificial intelligence systems and machine learning methods for boards of directors (preprint, unofficial translation)

2025-08-09

Авторы:

Anna Romanova

Растущее влияние искусственного интеллекта (ИИ) в корпоративном управлении вызывает новые проблемы, связанные с нехваткой достаточного юридического и этического регулирования. Авторы статьи предлагают новую структуру для развития и реализации автономных ИИ-систем в управлении компаниями. Основной идеей является создание "компьютерного права" — алгоритмической системы права, где правила закона представлены в машиночитаемом виде. Исследование подчеркивает необходимость "операционного контекста" для ИИ, подобно операционному домену для автономных автомобилей, чтобы обеспечить безопасность и эффективность. Авторы предлагают использовать синтетические данные для обучения ИИ и применять игровую теорию для оптимизации решений в рамках этических и юридических ограничений. Ключевой акцент делается на "исправительном ИИ" (explainable AI) для достижения прозрачности и ответственности решений. Основным выводом является, что только через такие системы можно обеспечить доверие и соответствие новым юридическим и этическим стандартам.

Annotation:

The study addresses the paradigm shift in corporate management, where AI is moving from a decision support tool to an autonomous decision-maker, with some AI systems already appointed to leadership roles in companies. A central problem identified is that the development of AI technologies is far outpacing the creation of adequate legal and ethical guidelines. The research proposes a "reference model" for the development and implementation of autonomous AI systems in corporate management. This ...

ID: 2508.03769v1 cs.CY, cs.AI, cs.LG

arXiv PDF

📄 Trustworthiness of Legal Considerations for the Use of LLMs in Education

2025-08-09

Авторы:

Sara Alaswad, Tatiana Kalganova, Wasan Awad

В статье анализируется законодательная и этическая база для использования Large Language Models (LLMs) в образовании, охватывая регионы: Европейский Союз, Великобритания, США, Китай и страны ГКС. Основной вопрос — как реализуются ключевые принципы доверия (прозрачность, справедливость, однозначная ответственность, защита данных и гуманитарное надзор) в различных юрисдикциях и как это отражается на нормативные акты и AI-стратегии. Особое внимание уделено потенциалу GCC-стран в развитии AI-ориентированных решений в образовании, где требуется добиться компромисса между местными традициями и международными стандартами. Исследование приводит к разработке Compliance-Centered AI Governance Framework, включающего типологию и инструменты для выравнивания AI-подходов с общепринятыми нормами и региональными особенностями. Результатом является практическое руководство для стратегического развития AI в образовательных системах, стремящихся сочетать нормативную совместимость с локальными ценностями.

Annotation:

As Artificial Intelligence (AI), particularly Large Language Models (LLMs), becomes increasingly embedded in education systems worldwide, ensuring their ethical, legal, and contextually appropriate deployment has become a critical policy concern. This paper offers a comparative analysis of AI-related regulatory and ethical frameworks across key global regions, including the European Union, United Kingdom, United States, China, and Gulf Cooperation Council (GCC) countries. It maps how core trustw...

ID: 2508.03771v1 cs.CY, cs.AI

arXiv PDF

📄 Agency, Affordances, and Enculturation of Augmentation Technologies

2025-08-09

Авторы:

Ann Hill Duin, Isabel Pedersen

**Резюме** В статье рассматривается проблема неоднозначности терминологии в исследованиях машинного обучения (ML) и искусственного интеллекта (AI). Авторы используют классификацию WIPO Categorization of AI Technologies Scheme для уточнения понятий, что помогает разграничить широкий спектр технологий AI. Отдельное внимание уделяется развитию нечеловеческих агентов в промышленности, которое является ключевым фактором в распространении augmentation technologies. Авторы исследуют, как маркетинг и коммуникация способствуют привлечению пользователей к новым технологиям, включая концепции Metaverse и расширенной реальности (AR). Они подчеркивают, что социальные и культурные факторы важны для успешного внедрения augmentation technologies в повседневную жизнь. Основные выводы: 1) Развитие AI приводит к переменам в социальных и технологических сферах; 2) Маркетинг и коммуникация играют ключевую роль в enculturation новых технологий; 3) Необходимо развитие критического мышления для оценки последствий распространения augmentation technologies.

Annotation:

Augmentation technologies are undergoing a process of enculturation due to many factors, one being the rise of artificial intelligence (AI), or what the World Intellectual Property Organization (WIPO) terms the AI wave or AI boom. Chapter 3 focuses critical attention on the hyped assumption that sophisticated, emergent, and embodied augmentation technologies will improve lives, literacy, cultures, arts, economies, and social contexts. The chapter begins by discussing the problem of ambiguity wit...

ID: 2508.04725v1 cs.CY, cs.AI

arXiv PDF

📄 Beyond risk: A proto-framework for assessing the societal impact of AI systems

2025-08-09

Авторы:

Willem Fourie

## КОНТЕКСТ И ПРОБЛЕМАТИКА В настоящее время регуляция искусственного интеллекта (ИИ) в большей степени сосредоточена на понятии "ответственный ИИ", где основной акцент делается на снижении рисков, связанных с разработкой и использованием ИИ. Хотя это направление важно и необходимо, оно не позволяет полноценно оценить и измерить влияние ИИ на общество в целом. Данная статья выступает за расширение этого подхода, предлагая фреймворк для оценки социального воздействия ИИ, основанный на понятии "свобода" как концептуального контраста к "ответственности". Автор подчеркивает, что существующие подходы к оценке рисков могут быть недостаточными для понимания широкого спектра воздействий ИИ на общество, включая положительные и негативные изменения в различных сферах жизни. Основная мотивация статьи заключается в том, чтобы разработать предварительный фреймворк (proto-framework) для систематической оценки социального воздействия ИИ, который может быть использован в контексте политического регулирования. Автор также подчеркивает важность интеграции этических и философских концепций, таких как свобода, в дискурс регуляции ИИ. ## ПРЕДЛОЖЕННЫЙ МЕТОД В качестве основы для своего фреймворка автор использует концепцию "свободы", развиваемую в рамках кантианской философии и современных интерпретаций. Свобода рассматривается в двух основных измерениях: "свобода как способность" (freedom as capability) и "свобода как возможность" (freedom as opportunity). Эти измерения позволяют охватить различные аспекты влияния ИИ на общество, включая его возможность расширять или ограничивать человеческие возможности. Предлагаемый фреймворк предлагает систематический подход к оценке социального воздействия ИИ, основанный на Целях устойчивого развития (Sustainable Development Goals, SDGs). Этот подход позволяет оценивать влияние ИИ на общество с точки зрения его вклада в достижение этих целей, а также выявлять потенциальные риски и выгоды. Фреймворк также предлагает методику для операционализации концепции свободы в контексте регуляции ИИ, что является важной шагом к созданию полноценной системы оценки. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ В статье не приводятся конкретные экспериментальные результаты, однако автор предлагает методологию для применения фреймворка на практике. Он предлагает использовать SDGs как рамку для оценки влияния ИИ на общество, что позволяет выявить области, где ИИ может иметь положительное или негативное воздействие. Автор также предлагает использовать этот фреймворк в качестве инструмента для политического регулирования, чтобы обеспечить более широкую и сбалансированную оценку влияния ИИ. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предлагаемый фреймворк имеет значительный практический потенциал для регуляции ИИ. Он может быть использован для оценки социального воздействия ИИ в различных сферах, включая здравоохранение, образование, экономику и окружающую среду. Интеграция концепции свободы в регуляцию ИИ может помочь создать более целостную и этически обоснованную систему оценки, которая будет учитывать не только риски, но и положительные аспекты ИИ. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ Основным достижением данной работы является предложение предварительного фреймворка для оценки социального воздействия ИИ, основанного на концепции свободы. Этот фреймворк может стать важной составляющей будущих исследований и разработок в области регуляции ИИ. Автор также выделяет необходимость дальнейшего развития этого фреймворка, включая его операционализацию и применение в реальных условиях. Будущие исследования могут фокусироваться на том, как этот фреймворк может быть интегрирован в существующие системы регуляции и как он может влиять на разработку более эффективных политик в области ИИ.

Annotation:

In the discourse on AI regulation, 'responsible AI' is the dominant paradigm, with the focus on mitigating the risks related to AI systems. While this focus is important and necessary, it has limited use for a systematic consideration of AI's societal impact. This paper proposes a proto-framework for assessing the societal impact of AI systems by operationalising the concept of freedom. This proto-framework is intended as a step towards a fully operationalised framework to be used in policymakin...

ID: 2508.03666v2 cs.CY, cs.AI, cs.ET

arXiv PDF

📄 Building Effective Safety Guardrails in AI Education Tools

2025-08-09

Авторы:

Hannah-Beth Clark, Laura Benton, Emma Searle, Margaux Dowland, Matthew Gregory, Will Gayne, John Roberts

## КОНТЕКСТ И ПРОБЛЕМАТИКА В последнее времени генеративные искусственные интеллектуальные (ИИ) инструменты получили широкое распространение в сфере образования, что привело к увеличению их использования преподавателями. Однако этот рост вызвал опасения относительно безопасности и соответствия возрасту генерируемого контента, который предназначен для использования в классах. При разработке таких инструментов возникают сложности, связанные с обеспечением того, чтобы контент соответствовал педагогическим стандартам и был безопасен для учеников в возрасте от 5 до 16 лет. Одним из ключевых вызовов является необходимость защиты от потенциальных угроз, таких как непреднамеренное создание неподходящего контента, а также внедрение мер, которые позволяют обеспечить высокий уровень качества и соответствия учебным целям. Дополнительным фактором является необходимость создания инструментов, которые не только генерируют контент, но и позволяют преподавателям контролировать и проверять его до использования в классе. Таким образом, разработка эффективных механизмов безопасности является ключевым элементом для успешного внедрения генеративных ИИ-инструментов в образовательную практику. В статье рассматривается подход Oak National Academy к разработке первого открытого генеративного ИИ-инструмента для образования, поддерживаемого правительством Великобритании – AI-powered lesson planning assistant (Aila). Целью Aila является поддержка преподавателей в создании уроков, соответствующих национальному учебному плану. Однако, чтобы смягчить риски, связанные с генерируемым контентом, были реализованы четыре ключевые меры безопасности: prompt engineering, защита от угроз входных данных, Independent Asynchronous Content Moderation Agent (IACMA) и подход human-in-the-loop, поощряющий преподавателей к проверке генерируемого контента перед его использованием в классе. ## ПРЕДЛОЖЕННЫЙ МЕТОД Разработка Aila основывается на четырех основных компонентах безопасности. Во-первых, prompt engineering используется для того, чтобы генерируемый контент оставался в рамках педагогически звучных и учебно-плановых параметров. Во-вторых, система защиты от угроз входных данных (input threat detection) предназначена для предотвращения возможных атак и непреднамеренного использования неправильных запросов. Третьей составляющей является Independent Asynchronous Content Moderation Agent (IACMA), который оценивает генерируемый контент на соответствие предопределенным категориям безопасности. Наконец, подход human-in-the-loop включает преподавателей в процесс проверки и утверждения контента перед его применением в классе. Этот подход позволяет обеспечить дополнительный уровень контроля и ответственности. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ В ходе оценки эффективности безопасности Aila было проведено ряд экспериментов. Данные, использованные для этих экспериментов, включали различные сценарии использования генерируемого контента в учебной практике. Результаты показали, что prompt engineering значительно повысил точность и соответствие контента учебным целям. Защита от угроз входных данных успешно предотвратила потенциальные атаки. IACMA эффективно оценивал контент на соответствие безопасности, а подход human-in-the-loop позволил преподавателям выявить и исправить потенциальные проблемы перед использованием контента в классе. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Практическая значимость этого исследования заключается в том, что оно предлагает комплексный подход к обеспечению безопасности генеративных ИИ-инструментов в образовании. Реализация таких мер может быть применена в различных образовательных учреждениях, чтобы гарантировать безопасность и качество генерируемого контента. Кроме того, открытые исходные коды, наборы данных и опыт, полученный в процессе разработки Aila, могут стать основой для сотрудничества между различными секторами и улучшения безопасности в будущем. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ В результате исследования были выявлены несколько ключевых выводов. При реализации безопасности в генеративных ИИ-инструментах важно постоянно отталкиваться от итеративного процесса улучшения и оценки эффективности мер безопасности. Кроме того, сотрудничество между различными секторами и обмен открытыми ресурсами может способствовать развитию более эффективных методов защиты. Будущие исследования могут фокусироваться на дальнейшем улучшении этих методов и расширении областей их применения.

Annotation:

There has been rapid development in generative AI tools across the education sector, which in turn is leading to increased adoption by teachers. However, this raises concerns regarding the safety and age-appropriateness of the AI-generated content that is being created for use in classrooms. This paper explores Oak National Academy's approach to addressing these concerns within the development of the UK Government's first publicly available generative AI tool - our AI-powered lesson planning ass...

ID: 2508.05360v1 cs.CY, cs.AI

arXiv PDF

Показано 271 - 280 из 282 записей