📚 Саммари научных статей из arXiv

Найдено 282 результатов по запросу 'cs.CY, cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 STREAM (ChemBio): A Standard for Transparently Reporting Evaluations in AI Model Reports

2025-08-15

Авторы:

Tegan McCaslin, Jide Alaga, Samira Nedungadi, Seth Donoughe, Tom Reed, Rishi Bommasani, Chris Painter, Luca Righetti

## Контекст Исследования по оценке опасных возможностей искусственного интеллекта (AI) являются ключевыми для снижения рисков катастрофического масштаба. Одной из главных проблем в этой сфере является недостаточная транспарентность в оценках моделей AI, что мешает построению доверия к AI. Особенно серьезная роль играет область кинетики химических и биологических процессов (ChemBio), где оценки могут повлиять на безопасность, экономику и экологию. Несмотря на важность транспарентных оценок, существуют затруднения в том, какие аспекты этих оценок требуется раскрыть, чтобы помочь пользователям оценить их качество и достоверность. ## Метод Предлагаемый метод, STREAM (ChemBio), является стандартом для транспарентного представления оценок в отчетах об AI-моделях. Он состоит из нескольких ключевых элементов, включая подробное описание задач, критериев оценки, методов исследований и результатов. Методология опирается на консультации с 23 экспертами из разных сфер: правительственных органов, некоммерческих организаций, академии и передовых AI-компаний. Архитектура STREAM включает трехстраничный шаблон отчета, который может быть использован AI-разработчиками для повышения ясности и полноты описания оценок. ## Результаты Исследования показали, что применение STREAM улучшает транспарентность в оценках моделей AI в области ChemBio. Эксперименты проводились на данных, отражающих различные метрики безопасности и эффективности. Результаты показали, что отчеты, соответствующие STREAM, лучше позволяют пользователям оценить качество и достоверность этих оценок. В частности, шаблон STREAM демонстрирует готовые решения для достижения лучшего качества представления результатов. ## Значимость STREAM может быть применен в различных областях, где требуется транспарентность оценки моделей AI, включая кинетику химических реакций, биологические процессы и другие сферы. Он позволяет улучшить доверие к AI, обеспечивая более прозрачные и доступные оценки. Значительным преимуществом является удобство использования шаблона STREAM, что делает его рекомендации привлекательными для AI-разработчиков и третьих сторон. Будущими направлениями исследований является расширение STREAM на другие области и модели AI, а также изучение его эффективности в практических ситуациях. ## Выводы STREAM (ChemBio) представляет собой важный шаг к транспарентной отчетности в AI-оценках, особенно в области ChemBio. Он позволяет улучшить доверие к AI, обеспечивая ясность и достоверность оценок. Основные достижения включают разработку т

Annotation:

Evaluations of dangerous AI capabilities are important for managing catastrophic risks. Public transparency into these evaluations - including what they test, how they are conducted, and how their results inform decisions - is crucial for building trust in AI development. We propose STREAM (A Standard for Transparently Reporting Evaluations in AI Model Reports), a standard to improve how model reports disclose evaluation results, initially focusing on chemical and biological (ChemBio) benchmarks...

ID: 2508.09853v1 cs.CY, cs.AI

arXiv PDF

📄 Assessing the Quality of AI-Generated Exams: A Large-Scale Field Study

2025-08-14

Авторы:

Calvin Isley, Joshua Gilbert, Evangelos Kassos, Michaela Kocher, Allen Nie, Emma Brunskill, Ben Domingue, Jake Hofman, Joscha Legewie, Teddy Svoronos, Charlotte Tuminelli, Sharad Goel

## Контекст Образовательная сфера сталкивается с значительными изменениями, связанными с внедрением технологий искусственного интеллекта (ИИ). Одним из актуальных направлений является использование бо LLM (больших моделей языковых моделей) для создания тестовых заданий. Это привносит новые возможности для эффективного, масштабируемого и настраиваемого обучения. Однако существуют вопросы о качестве таких заданий и их ответом на психометрические критерии. Недостаток исследований по этим вопросам ограничивает понимание реального потенциала ИИ в образовательных тестах. Наша мотивация заключается в изучении и оценке качества AI-генерируемых тестов в реальных условиях обучения, чтобы определить их психометрические свойства и потенциал для улучшения образовательных процессов. ## Метод Мы разработали инновационную методологию, основанную на итеративном подходе к созданию и оценке AI-тестовых заданий. Этот подход включает в себя генерирование вопросов с помощью бо LLM, циклическую оценку и корректировку этих вопросов на основе ЛЛМ-анализа. Наша стратегия включает в себя несколько этапов: 1. Генерация вопросов с использованием бо LLM. 2. Ручная оценка качества вопросов. 3. Внедрение предложенных изменений в LLM для повышения качества. 4. Повторение циклов до получения оптимальных результатов. Оценка качества подвергается методологии "item response theory" (IRT), которая позволяет анализировать ответы студентов и сравнивать их с классическими тестами. Данные из 91 курсов, включающих различные области (компьютерные науки, математика, химия), позволили нам провести широкомасштабное исследование. ## Результаты В ходе исследования мы проанализировали поведение 1670 студентов, протестировавших AI-генерируемые тесты в сравнении с экспертно созданными тестами. Результаты показали, что показатели качества AI-тестов соответствовали показателям экспертных тестов. Наши данные подтвердили, что AI-тестовые задания демонстрируют высокую психометрическую точность и эффективность в реальных условиях. Большая часть вопросов, полученных через итеративный метод, прошла тестирование на соответствие критериям качества и были успешно приняты в реальных курсах. ## Значимость Наши результаты открывают перспективы для широкого использования AI в образовательных тестах. Это может повысить эффективность процесса создания тестов, уменьшить время и ресурсы, необходимые для экспертного контроля. AI может стать инструментом для создания настраиваемых, качественных тестов для различных областей, что позволит улучшить индивидуальный подход к обучению. Мы также от

Annotation:

While large language models (LLMs) challenge conventional methods of teaching and learning, they present an exciting opportunity to improve efficiency and scale high-quality instruction. One promising application is the generation of customized exams, tailored to specific course content. There has been significant recent excitement on automatically generating questions using artificial intelligence, but also comparatively little work evaluating the psychometric quality of these items in real-wor...

ID: 2508.08314v1 cs.CY, cs.AI

arXiv PDF

📄 EU Digital Regulation and Guatemala: AI, 5G, and Cybersecurity

2025-08-14

Авторы:

Victor Lopez Juarez

## Контекст В последние десятилетия цифровая регулирование стала важной частью глобальной политики, особенно в сферах искусственного интеллекта (AI), 5G-технологий и цифровой безопасности. Европейский Союз (ЕС) взял на себя лидерскую роль в развитии и внедрении строгих нормативных регулирований в эти области. Однако международная природа цифровых технологий создает вызов для регулирования, которое должно учитывать многообразие локальных контекстов. В этом контексте это исследование фокусируется на влиянии европейского цифрового регулирования на Гватемалу, крайней точке глобальной цепи. Гватемала представляет собой интересный случай для исследования, так как она слабо взаимодействует с ЕС в сфере цифровых технологий, но осуществляет экспорт в ЕС и подвержена его нормам. Это исследование исследует, как ЕС-нормы определяют политики в Гватемале в сферах AI, 5G и цифровой безопасности, а также какие локальные затруднения и возможности возникают в результате этого влияния. ## Метод Методология исследования включает комплексный анализ нормативных документов, сравнительный анализ между европейскими и гватемальскими политиками, а также историко-тенденционный анализ, показывающий динамику взаимодействия между ЕС и Гватемалой. Исследование также использует интервью с экспертами и анализ практик реализации национальных мер в Гватемале. Для анализа влияния европейских норм на Гватемалу в рамках цифровой сферы, используется подход, основанный на теории "Европейского Эффекта" (Brussels Effect), в котором ЕС становится неявным регулятором за пределами собственных границ. Этот эффект охватывает не только прямое влияние ЕС-норм, но и влияние частных стандартов, поставочных цепей и политик контроля данных. ## Результаты Исследование выявило существенное влияние европейских норм на цифровой сектор Гватемалы. Это влияние проявляется в следующих областях: 1. **Правовые и финансовые нагрузки** для малых и средних предприятий (SME), требующих соблюдать европейские стандарты для взаимодействия с международным рынком. 2. **Ограничения в государственных закупках**, когда государственные учреждения должны придерживаться ЕС-нормативных требований при приобретении технологий. 3. **Экологические торговые оффшоры**, возникающие в результате роли ЕС в установлении требований к снижению углеродных выбросов в рамках роли 5G-ролевого провайдера. 4. **Возможные правовые и экономические риски** для прав человека, таких как право на конфи

Annotation:

The paper examines how EU rules in AI, 5G, and cybersecurity operate as transnational governance and shape policy in Guatemala. It outlines the AI Act's risk approach, the 5G Action Plan and Security Toolbox, and the cybersecurity regime built on ENISA, NIS2, the Cybersecurity Act, and the Cyber Resilience Act. It traces extraterritorial channels such as the Brussels effect, private standards, supply chain clauses, and data transfer controls. Guatemala specific impacts include SME compliance cos...

ID: 2508.08315v1 cs.CY, cs.AI, cs.ET

arXiv PDF

📄 Towards Experience-Centered AI: A Framework for Integrating Lived Experience in Design and Development

2025-08-14

Авторы:

Sanjana Gautam, Mohit Chandra, Ankolika De, Tatiana Chakravorti, Girik Malik, Munmun De Choudhury

## Контекст Область исследования связана с воздействием живых людских опытов на взаимодействие с искусственным интеллектом (ИИ). Живые опыты включают эмоциональные, контекстуальные и индивидуальные аспекты человеческого поведения, которые влияют на отношение к ИИ, его доверие и эффективность. Несмотря на предыдущие усилия по созданию моделей, которые эмулируют человеческие предпочтения, и развитию категорий рисков (например, психологических вредах и алгоритмических биасах), есть ограниченное понимание того, как живые опыты влияют на взаимодействие с ИИ. Эта работа предлагает рамку для интеграции живых опытов в разработку и оценку ИИ, чтобы создавать более человечно-ориентированные системы. ## Метод Разработанная рамка основывается на синтезе интердисциплинарной литературы из философии живых опытов, людского-центрированного дизайна и интеракции человека-ИИ. Она включает в себя также анализ работ по психологии, образованию, здравоохранению и социальной политике. Фреймворк включает также таксономию живых опытов, которая применима к ИИ. Данная таксономия рассматривает эмоциональные, контекстуальные и ценностные аспекты взаимодействия с ИИ. Метод также включает эксперименты и анализ сценариев из трех областей: образования, здравоохранения и культурной адаптации, чтобы продемонстрировать, как живые опыты влияют на пользовательские цели, ожидания и этические соображения. ## Результаты Эксперименты показали, что приложение живых опытов в разработку ИИ приводит к моделям, которые более точно отражают человеческие эмоции, контексты и ценности. Например, в сфере образования, рамка позволила создать системы, которые учитывают индивидуальные опыты учащихся и учителей. В здравоохранении, она позволила создать более контекстуально ориентированные системы, более точно отражающие потребности пациентов. В культурной адаптации, она помогла разработать ИИ, который учитывает гендерные, этнические и культурные различия. Результаты также показали, что интеграция живых опытов улучшает доверие к системам ИИ и снижает риск алгоритмических ошибок. ## Значимость Полученные результаты имеют широкие области применения, включая образовательные технологии, здравоохранение и социальные сети. Рамка позволяет улучшить эти человечно-ориентированные технологии, сделав их более удобными для пользователей. Основные преимущества заключаются в том, что системы становятся более контекстуально ориентированными, более человечными и более эффективными в

Annotation:

Lived experiences fundamentally shape how individuals interact with AI systems, influencing perceptions of safety, trust, and usability. While prior research has focused on developing techniques to emulate human preferences, and proposed taxonomies to categorize risks (such as psychological harms and algorithmic biases), these efforts have provided limited systematic understanding of lived human experiences or actionable strategies for embedding them meaningfully into the AI development lifecycl...

ID: 2508.06849v1 cs.CY, cs.AI, cs.HC

arXiv PDF

📄 Between Fear and Desire, the Monster Artificial Intelligence (AI): Analysis through the Lenses of Monster Theory

2025-08-14

Авторы:

Ahmed Tlili

## Контекст В последние годы Artificial Intelligence (AI) устойчиво завоевывает новые сферы жизнедеятельности человека, от промышленности до образования и здравоохранения. Это связано с ростом надежд на прорывные технологии, которые могут упростить жизнь и расширить возможности. Однако с AI возникают и значительные опасения, включая угрозы безопасности, этические проблемы и влияние на рынок труда. Эти противоречивые аспекты порождают частые дискуссии о том, как грамотно и эффективно внедрять AI в общество. В центре этого исследования — использование монстрологии как подхода для анализа представлений о AI. Монстры, как понятие, часто служат зеркалом для осмысления человеческой паники, страха и стремления к изменениям. Этот подход позволяет погрузиться в нестабильность и границу между радостью от новых технологий и страхом перед их непредсказуемостью. Таким образом, это исследование адресовано выявлению того, как AI может быть воспринят как монстр в популярной культуре и какие уроки можно извлечь для его будущего развития. ## Метод Исследование основывается на монстрологической теории, которая рассматривает монстр как символ противоречий и границы между привычным и чужим. Для анализа AI применяется теза Джонатана Хэзера о семь элементов монстра: его рождение, искажение, рефлексия, граница, потеря, паника и трансформация. Эти понятия применяются для изучения аспектов AI, включая его создание, репрезентацию в медиа, восприятие человечеством, неопределенность его действий и последствий его применения. Данные для исследования были получены из анализа популярных культурных произведений, новостных материалов и литературы, связанной с AI. Данные проанализированы с помощью теоретических инструментов монстрологии, чтобы выявить сходства в поведении монстров и AI в контексте человеческого опасения и желания. ## Результаты Исследование показало, что AI может быть воспринято как монстр из-за его неопределенности, непредсказуемости и потенциального воздействия на человеческую жизнь. Как монстры в популярных произведениях, AI оказывает влияние на чувства человечества, между желанием пользоваться его возможностями и страхом от непредсказуемых последствий. Например, AI часто изображается как символ потери контроля, напоминая монстров, которые выходят из-под управления людей. Это отражается в предсказаниях о том, что AI может стать неподконтрольной силой, нарушающей естественный порядок. Также AI, как и монстры, оказывает значительное воздействие на концепции границ и идентичности, порождая беспокойство о том

Annotation:

With the increasing adoption of Artificial Intelligence (AI) in all fields and daily activities, a heated debate is found about the advantages and challenges of AI and the need for navigating the concerns associated with AI to make the best of it. To contribute to this literature and the ongoing debate related to it, this study draws on the Monster theory to explain the conflicting representation of AI. It suggests that studying monsters in popular culture can provide an in-depth understanding o...

ID: 2508.08318v1 cs.CY, cs.AI

arXiv PDF

📄 Making Effective Decisions: Machine Learning and the Ecogame in 1970

2025-08-14

Авторы:

Catherine Mason

## Контекст Ecogame, ярко выражающаяся исследовательская проектная работа 1970 года, стала важной идеологической и технологической досьей современности. Её авторы оснащались уверенностью в будущем, где человечество будет увлечено сочетанием цифровых технологий и демократического участия. Это исследование основывалось на основе cybernetics, сочетая в себе визуальное искусство, симуляции и элементы ранних методов машинного обучения. Оно использовало live network для симуляции системы, в которой поведение индивидуальных агентов имело влияние на общую систему. Из-за своей новизны и ценности в решении широкомасштабных вопросов, Ecogame стала предложить первый пример использования AI-driven art с упором на human-centred approach. ## Метод Ecogame призывала к созданию удобочитаемой и интерактивной системы, основанной на cybernetics. Основным методом был непосредственный взаимодействий между участниками и системой, в которой использовались цифровые средства. Метод состоял в симуляции системы в режиме live network, где индивидуальное поведение влияло на развитие системы в целом. Это позволяло создателям проверить модели взаимодействия в реальном времени. Участники могли участвовать в развитии системы, а использование ранних методов машинного обучения позволило адаптировать систему к изменяющимся условиям. ## Результаты Результаты Ecogame были значительными и включали моделирование многоагентных систем, где каждый участник мог влиять на систему. Данные поведения могли быть структурированы, анализированы и использованы для создания визуальных выводов. Это позволило показать, как адаптивность и контроль могли дать более полное понимание системы. Эксперименты были проведены в условиях live network, что дало возможность получить реальные данные в ходе симуляции. Это дало возможность проверить модели на реальном потоке событий и позволило искать решения в жизненных условиях. ## Значимость Ecogame приобрела значимость как первая в своём роде исследовательская работа, которая показала возможность использования AI-driven art для решения реальных проблем. Она стала предвосхитить современные использования ИИ в целях повышения эффективности решений с учётом human-centred approach. Работа показала, как можно использовать AI для оптимизации систем, и тем самым улучшить работу в широком круге областей, включая управление ресурсами, городское планирование и даже социальные взаимоотношения. Ecogame также демонстрировала, каким образом современные системы могут иметь улучшенную понятность и прозрачность, что позволяет участникам сделать более обоснованные решения. ## Выводы Ecogame стала значимой путей для развития AI-driven art, пока

Annotation:

This paper considers Ecogame, an innovative art project of 1970, whose creators believed in a positive vision of a technological future; an understanding, posited on cybernetics, of a future that could be participatory via digital means, and therefore more democratised. Using simulation and early machine learning techniques over a live network, Ecogame combined the power of visual art with cybernetic concepts of adaptation, feedback, and control to propose that behaviour had implications for the...

ID: 2508.07027v1 cs.CY, cs.AI

arXiv PDF

📄 Normative Moral Pluralism for AI: A Framework for Deliberation in Complex Moral Contexts

2025-08-14

Авторы:

David-Doron Yaacov

## Контекст Научное исследование сосредоточено на развитии системы делиберативного морального разума, которая может обрабатывать сложные моральные ситуации. Эта проблема возникает в связи с ростом необходимости в морально направленных решениях в рамках машинного обучения и виртуальных ассистентов. Одним из главных источников мотивации является необходимость развития моделей, которые способны не только действовать в соответствии с моральными нормами, но и объяснять свои решения в зависимости от контекста. Существующие системы часто не в состоянии учитывать коллективную многообразие взглядов на моральные ценности, что приводит к ограниченности в реализации ценностного выравнивания (Value Alignment). Исследование предлагает рамку для решения этой проблемы, основанную на нормативном моральном плюрализме. ## Метод Методология построена на основе нормативного морального плюрализма, который предполагает учет широкого спектра моральных перспектив. Технический подход включает разработку двухуровневой архитектуры: глобального и локального уровней. Глобальный уровень определяет маргины моральных норм через топо-донное и базо-верхнее обучение, а локальный уровень учитывает контекстные различия и культурные нормы. Архитектура разработана для работы в условиях времени ограничений и включает в себя модели, которые могут объяснять свои решения. Для обработки сложных моральных дилемм включены механизмы фильтрации и взвешивания аргументов, способных учитывать не только моральные, но и неморальные факторы. ## Результаты Исследование основывается на экспериментах с различными ситуациями, включая сложные дилеммы, где необходимо учитывать множество факторов и участников. Данными для экспериментов пользовались ситуационные задачи, синтезированные для моделирования реальных сложностей. Результаты показали, что система демонстрирует возможность обоснованного морального решения, при этом умещаясь в рамки времени ограничений. Особое внимание уделено транспарентности решений и возможности их объяснения за счет принципиального подхода к разработке. ## Значимость Предлагаемый подход имеет широкие теоретические и практические применения. Он может быть использован в области робототехники, виртуальных ассистентов, систем медицинского робототвода и даже в сфере юридических выводов. Одним из основных преимуществ является возможность учитывать культурно-зависимые нормы, что делает систему более включающей и реалистичной. Также система может в будущем стать основой для развития моделей, работающих в реальном времени, сочетая глубокую мора

Annotation:

The conceptual framework proposed in this paper centers on the development of a deliberative moral reasoning system - one designed to process complex moral situations by generating, filtering, and weighing normative arguments drawn from diverse ethical perspectives. While the framework is rooted in Machine Ethics, it also makes a substantive contribution to Value Alignment by outlining a system architecture that links structured moral reasoning to action under time constraints. Grounded in norma...

ID: 2508.08333v1 cs.CY, cs.AI

arXiv PDF

📄 Algorithmic Fairness amid Social Determinants: Reflection, Characterization, and Approach

2025-08-14

Авторы:

Zeyu Tang, Alex John London, Atoosa Kasirzadeh, Sanmi Koyejo, Peter Spirtes, Kun Zhang

## Контекст Область исследования социального характера в алгоритмической справедливости становится все более важной в поиске баланса между эффективностью и справедливостью в различных ситуациях принятия решений. Одной из проблем является то, что существующая литература алгоритмической справедливости сконцентрирована на признаках (или атрибутах), которые явно связаны с отдельным индивидуумом. Это означает, что важные контекстные факторы, такие как социальные детерминанты (например, уровень дохода, местоположение, культурно-экономические факторы), часто остаются недооцененными или не учтенными. Эти социальные детерминанты могут иметь значительное влияние на жизненные исходы индивидуума, но их далеко не всегда учитывают при оценке справедливости. Наша мотивация заключается в установлении теоретических и практических фреймворков для учета этих факторов, чтобы улучшить понимание и моделирование справедливости в различных контекстах. ## Метод Мы предлагаем подход, сочетающий теоретическую ясность и практическую применимость, чтобы учесть социальные детерминанты в алгоритмической справедливости. Основные элементы нашего метода включают: 1. **Региональный анализ**: Мы используем регион как прокси для социальных детерминантов, что позволяет группировать индивидуумов по крупным социальным характеристикам. 2. **Параметризация Gamma-распределения**: Мы аппроксимируем распределение результатов исходов индивидуумов в разных регионах с помощью Gamma-распределения. Это позволяет характеризовать отклонения в индивидуальных выигрышах и потерях в рамках каждого региона. 3. **Теоретический разбор**: Мы развиваем формальные определения справедливости, которые учитывают оба фактора: социальные детерминанты и признаки, связанные с отдельными индивидуумами. 4. **Пример из реального мира**: Мы применили наш подход к конкретной ситуации колледжей, где регион может сильно влиять на возможности в сфере образования. ## Результаты Мы проверили наш подход на реальных данных, анализируя результаты колледжей в разных регионах. Наши эксперименты показали, что: 1. **Глубина влияния социальных детерминантов**: Некоторые регионы демонстрируют чрезвычайно высокие или низкие результаты из-за социальных детерминантов, что может привести к структурной несправедливости. 2. **Проблемы существующих методов**: Методы, которые сконцентрированы только на признаках, могут не только не устранить существующую несправедливость, но и создать новые виды несправедливости. 3. **Комплексный подход**: Комбинирование социальных детерминантов с признаками д

Annotation:

Social determinants are variables that, while not directly pertaining to any specific individual, capture key aspects of contexts and environments that have direct causal influences on certain attributes of an individual. Previous algorithmic fairness literature has primarily focused on sensitive attributes, often overlooking the role of social determinants. Our paper addresses this gap by introducing formal and quantitative rigor into a space that has been shaped largely by qualitative proposal...

ID: 2508.08337v1 cs.CY, cs.AI, cs.LG

arXiv PDF

📄 Do AI Companies Make Good on Voluntary Commitments to the White House?

2025-08-14

Авторы:

Jennifer Wang, Kayla Huang, Kevin Klyman, Rishi Bommasani

## Контекст В последние годы искусственный интеллект (AI) стал значительным фактором в мировой экономике и общественной жизни. Однако возникают вопросы о корпоративной ответственности AI-компаний и их соблюдении этичных стандартов. В связи с этим, Белый дом выпустил в 2023 году 8 обязательств для AI-компаний, направленных на улучшение безопасности, прозрачности и этичности AI-технологий. Эти обязательства, хотя и не являются юридически обязательными, стали ключевым инструментом в международном управлении AI. Однако насущный вопрос: соблюдают ли компании эти обязательства? Наше исследование анализирует это и дает понять, насколько эффективно AI-компании выполняют свои обязательства. ## Метод Для оценки соблюдения обязательств AI-компаний была разработана систематическая методика, использующая рейтинговую шкалу с 8 критериями, соответствующими каждому обязательству. Для каждого критерия был присвоен балл от 0 до 100, в зависимости от уровня соответствия компании требованиям. Исследование основывалось на открытом доступу к отчетам о соблюдении этих обязательств, предоставленным 16 крупнейшими AI-компаниями. Мы разработали конкретные числовые показатели для каждого критерия, чтобы получить четкий результат для каждой компании. ## Результаты Наши результаты показали существенную разницу в уровне соблюдения обязательств. Наивысший рейтинг (83%) был получен компанией OpenAI, в то время как средний рейтинг для всех компаний составил 52%. Особенно низкая была оценка по выполнению обязательств по безопасности моделей (weights security): средний рейтинг составил 17%, и 11 из 16 компаний получили 0%. Это указывает на существенную проблему в области защиты моделей AI от несанкционированного использования. Общий низкий результат также отражает недостаток детальных отчетов об обязательствах, что препятствует проверке и отчетности. ## Значимость Наши результаты имеют важное значение для политики, академии и индустрии AI. Они подтверждают необходимость создания более строгих мер корпоративной ответственности, включая прозрачность и проверку отчетов. Эти обязательства могут быть применены не только в США, но и в международных AI-инициативах. Наша исследовательская работа демонстрирует потенциал для лучшей ответственности AI-компаний и помогает развитию эффективных международных AI-правил. ## Выводы Мы подтвердили, что, хотя некоторые компании показывают высокий уровень соблюдения обязательств, многие остаются за кулисами, не обеспечивая достаточную прозрачно

Annotation:

Voluntary commitments are central to international AI governance, as demonstrated by recent voluntary guidelines from the White House to the G7, from Bletchley Park to Seoul. How do major AI companies make good on their commitments? We score companies based on their publicly disclosed behavior by developing a detailed rubric based on their eight voluntary commitments to the White House in 2023. We find significant heterogeneity: while the highest-scoring company (OpenAI) scores a 83% overall on ...

ID: 2508.08345v1 cs.CY, cs.AI

arXiv PDF

📄 Processing of synthetic data in AI development for healthcare and the definition of personal data in EU law

2025-08-14

Авторы:

Vibeke Binz Vallevik, Anne Kjersti C. Befring, Severin Elvatun, Jan Franz Nygaard

## Контекст Исследование фокусируется на проблемах, связанных с использованием синтетических данных в развитии искусственного интеллекта (AI) в сфере здравоохранения. Особенностью этой области является необходимость больших объемов качественных данных для тренировки моделей AI, что приводит к затруднениям в обеспечении конфиденциальности и защиты персональных данных. Данные, синтезированные с помощью машинного обучения на основе реальных данных, представляют собой полезный метод для обеспечения доступа к данным, поддерживая при этом уровень конфиденциальности. Тем не менее, неоднозначности в применении Регуляции Общей Директивы защиты данных (GDPR) приводят к техническим и правовым неоднозначностям, что ограничивает потенциальные выгоды синтетических данных. Целью исследования является определение, подпадает ли синтетическая данная под определение "персональных данных" в соответствии с GDPR, и оценка риска идентификации через генерирование синтетических данных и эмпирические исследования. ## Метод Исследование основывается на систематическом анализе законодательства и правовых актов, связанных с GDPR, а также на эмпирических исследованиях. Авторы применяют метод генерирования синтетических данных с помощью машинного обучения, а также моделируют атаки на идентификацию с помощью метода генерации векторов входа (inference attacks). Это позволяет оценить риск идентификации в системах синтетических данных. Также проводится сравнение существующих критериев идентификации в GDPR с техническими возможностями синтетических данных. Результаты исследования основываются на анализе технических моделей и законодательных аспектов, чтобы изучить возможность классификации синтетических данных как персональных данных. ## Результаты Исследование показало, что синтетическая данная, возможно, может быть носителем риска идентификации, но в зависимости от степени защиты и способа ее генерации, этот риск может быть существенно снижен. Эмпирические результаты показали, что многие запросы на идентификацию с помощью технических методов не успешны, что выделяет риск идентификации как достаточно низкий для нормативной определения. Однако, исследование выявляет узкие места в нормативной определении "персональных данных" в GDPR, которые могут привести к неоднозначности в технических и правовых сферах. ## Значимость Результаты исследования имеют значимый потенциал для продвижения инноваций в области AI в здравоохранении. Они подчеркивают важность более ясных и ясных нормативных критериев для классификации синтетических данных в GDPR, чтоб

Annotation:

Artificial intelligence (AI) has the potential to transform healthcare, but it requires access to health data. Synthetic data that is generated through machine learning models trained on real data, offers a way to share data while preserving privacy. However, uncertainties in the practical application of the General Data Protection Regulation (GDPR) create an administrative burden, limiting the benefits of synthetic data. Through a systematic analysis of relevant legal sources and an empirical s...

ID: 2508.08353v1 cs.CY, cs.AI

arXiv PDF

1
2
24
25
26
27
28
29

Показано 251 - 260 из 282 записей