📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Yu yang

## Контекст В последние годы развитие искусственного интеллекта (AI) вызвало мировую промышленную трансформацию, попав в такие области, как финансы, здравоохранение, образование и производство. Однако этот быстрый рост часто превращается в нерациональное развитие, когда компании бездумно инвестируют в новые технологии из-за технологического бума, не учитывая систематический анализ их ценности. Этот феномен создает огромные риски для бизнеса, так как неэффективные инвестиции могут привести к финансовым потерям или даже к серьезным негативным последствиям. Данная статья призвана решить эту проблему, разработав модель оценки ценности AI-продуктов, которая была бы достаточно широкой и точной для систематического использования в различных отраслях. Идея заключается в интеграции разных научных подходов: информационной теории, экономики и психологии. ## Метод Модель оценки ценности AI-продуктов основывается на нескольких ключевых идеях. Во-первых, **информационная теория** используется для определения "потенциального значения" продукта, который заключается в снижении неопределенности и улучшении точности решений. Во-вторых, **экономический подход** строится на концепции "ограниченной рациональности", что позволяет учитывать не только прибыльность, но также риски и негативные последствия. И, наконец, **психология** привлекается для исследования неоправданных решений, которые часто влияют на выбор и принятие решений о покупке. В результате, модель предлагает нелинейную формулу, которая учитывает зависимости между этими факторами. Она также включает в себя меры для измерения как положительных (полезных), так и отрицательных (рисков) аспектов AI-продуктов. Эта модель была применена к 10 коммерческим случаям для проверки ее эффективности. ## Результаты Исследования показали, что модель позволяет эффективно отличать успешные AI-продукты от неудачных. Например, успешные продукты обычно показывают высокую степень уменьшения неопределенности, повышение эффективности и экономию затрат, при этом с минимальными рисками. Однако неудачные продукты часто имеют высокую вероятность ошибок, высокие затраты на исправление ошибок и негативное воздействие на пользователей. На основе этих результатов, модель демонстрирует, что успешные AI-продукты имеют не только высокую "положительную стоимость", но и значительно нижую "отрицательную стоимость" благодаря уменьшению рисков и негативных последствий. Это подтверждает гипотезы о синергетических положительных эффектах и нелинейных отрицательных регуляциях. ## Значимость
Annotation:
In recent years, breakthroughs in artificial intelligence (AI) technology have triggered global industrial transformations, with applications permeating various fields such as finance, healthcare, education, and manufacturing. However, this rapid iteration is accompanied by irrational development, where enterprises blindly invest due to technology hype, often overlooking systematic value assessments. This paper develops a multi-dimensional evaluation model that integrates information theory's en...
ID: 2508.16714v1 cs.CY, cs.AI
Авторы:

Yahya Badran, Christine Preisach

## Контекст Knowledge Tracing (KT) — это проблематика предсказания будущего ученика на основе его взаимодействий с материалом обучения. Основной набор данных для моделей KT из секвенции ответов на вопросы включает в себя различные аспекты, такие как порядок и время взаимодействий, знания концепций (KCs) — набор навыков, необходимых для каждого задания. Тем не менее, многие KT-модели страдают от проблемы лейбл-лейк, когда входные данные нечаянно раскрывают правильный ответ, особенно в условиях нескольких KCs на каждый вопрос. Эта проблема повлияла на точность предсказаний в различных KT-моделях. ## Метод Мы предложили несколько решений для того, чтобы устранить эту проблему. Наша основная техника — маскирование лейблов при построении входных эмбеддингов в определенных случаях, когда данные скрывают лейблы. Для этого мы вводим новый MASK-лейбл, выдержанный в стиле масок моделей типа BERT. Это позволяет защитить модели от негативного влияния лейбл-лейка. Кроме того, мы представили идею Recency Encoding, которая основывается на учете шагового расстояния между текущим заданием и его предыдущим во времени. Эта новая форма позиционного кодирования позволяет лучше моделировать гармонические отношения в обучении, включая процессы забывания. ## Результаты Мы провели эксперименты с использованием различных KT-моделей, таких как DKT, DKT+, AKT и SAKT, и использовали несколько наборов данных, включая ASSISTments и Junyi Academy. Наши результаты показывают, что применение нашей техники MASK-метки и Recency Encoding существенно повышает точность предсказаний моделей в сравнении с базовыми версиями. Эффект особенно заметен в случаях, когда данные имеют сильный лейбл-лейк. Эти изменения также работают эффективно в контексте небольших данных, что демонстрирует их широкую применимость. ## Значимость Наши решения могут быть применены в различных областях, где KT используется для личной ориентации в обучении, анализа содержания и синтеза учебных материалов. Мы показали, что наши новые методы не только улучшают точность, но и повышают устойчивость моделей к негативному влиянию лейбл-лейка. Это делает нашу работу важной для улучшения пользовательских подходов в обучении, а также для повышения качества моделей, использующих различные виды разметки. ## Выводы Мы предложили новые методы для устранения определенных проблем в Knowledge Tracing — в частности, лейбл-лейка и недостаточного учета динамики обучения в распознавании KCs. Наши релизовые результаты показали, что обеспечение MASK-метода и Recency Encoding может значительно улучшить точность и устойчивость KT-моделей. Мы направились на дальнейшее иссле
Annotation:
Knowledge Tracing (KT) aims to predict a student's future performance based on their sequence of interactions with learning content. Many KT models rely on knowledge concepts (KCs), which represent the skills required for each item. However, some of these models are vulnerable to label leakage, in which input data inadvertently reveal the correct answer, particularly in datasets with multiple KCs per question. We propose a straightforward yet effective solution to prevent label leakage by mask...
ID: 2508.17092v1 cs.CY, cs.AI, cs.LG
Авторы:

Kaiyuan Zhang, Jiaqi Li, Yueyue Wu, Haitao Li, Cheng Luo, Shaokun Zou, Yujia Zhou, Weihang Su, Qingyao Ai, Yiqun Liu

## Контекст Область исследования — создание моделей систем максимально похожих на реальные судебные процессы с использованием технологий больших языковых моделей (LLM). Одна из проблем состоит в том, что традиционные максимально подробные судебные симуляции труднодоступны для широкой публики, так как они требуют наличия профессиональных юристов и имитируют ограниченное количество ситуаций. Рост LLMs дает возможность создания систем, которые не только могут легко доступны, но и могут давать новые возможности для обучения юридическим процессам, анализа судебных ситуаций и прогнозирования их результатов. Однако существующие исследования сконцентрированы лишь на создании агентов, не обращая достаточного внимания на системный подход к созданию симуляций, что влияет на их реальность и эффективность. Мы предлагаем SimCourt — первую систему симуляции судебных процессов, основанную на реалистичной структуре судебных процессов в Китае. ## Метод SimCourt имеет реалистичную структуру, которая соответствует пяти основным этапам китайского судебного процесса. Её работа основывается на 5 юридических ролях (судьи, защитника, обвинителя, свидетеля и судебного секретаря). Для того, чтобы сделать каждую роль более реалистичной, мы внедрили в агентов способность хранить память, планировать свои действия и вносить информацию в рефлексию. Мы использовали техники, позволяющие LLMs работать в среде с синтетическими данными, чтобы эффективно описать агентов в различных ситуациях. Это позволяет обеспечить высокую достоверность симуляции, даже в условиях отсутствия реальных данных. ## Результаты Мы проверили SimCourt на задаче юридического прогнозирования. Наши результаты показали, что симуляции, сформированные нашей системой, лучше помогают прогнозировать результаты судебных процессов, в том числе устанавливать тюремные сроки, пробати и штрафы. Также мы провели компаративный анализ с реальными судебными процессами, в котором агенты SimCourt вы mosts отогносили судей и юристов в сложных ситуациях. Это демонстрирует гибкость и реалистичность системы. Мы также провели эксперименты с отзывами человеческих экспертов, которые подтвердили высокую качественную реализацию нашей системы. ## Значимость SimCourt может быть применена в различных областях: изучение юридических процессов, обучение студентов юридических направлений, анализ судебных ситуаций и прогнозирование результатов судебных процессов. Она также может использоваться в сфере решения правовых проблем, в том числе для подготовки к практическим судебным процессам. Э
Annotation:
Mock trial has long served as an important platform for legal professional training and education. It not only helps students learn about realistic trial procedures, but also provides practical value for case analysis and judgment prediction. Traditional mock trials are difficult to access by the public because they rely on professional tutors and human participants. Fortunately, the rise of large language models (LLMs) provides new opportunities for creating more accessible and scalable court s...
ID: 2508.17322v1 cs.CY, cs.AI
Авторы:

Kyra Wilson, Sourojit Ghosh, Aylin Caliskan

## Контекст Текстово-изображенческие генераторы (T2Is) — мощные инструменты, которые могут генерировать изображения на основе текстовых запросов. Однако они также являются источником новых проблем, включая усиление стереотипов. Например, распространенное во многих областях мнение о том, что люди с темнотой кожей несут культурные или экономические стереотипы, может быть усилено из-за неосторожности в обучении генераторов. Это может привести к углублению существующих расовых и социальных дискриминаций. Мы исследуем, насколько глубоко эти проблемы влияют на T2I-модели, в частности на Stable Diffusion, и как они могут усиливать стереотипы, связанные с цветовой плоскостью кожи. ## Метод Мы использовали 93 стigmatизированных идентификаторов, которые могут привести к социальной дискриминации, такие как сексуальное ориентирование и религиозное убеждение. Для каждого идентификатора мы генерировали изображения с помощью трех версий Stable Diffusion (v1.5, v2.1, XL). Мы измеряли диапазон цветов кожи, неоднородность и разнообразие в изображениях результатов. Для того, чтобы метрики соответствовали человеческому восприятию, мы разработали новую методику. Также мы использовали сравнение с реальными данными лиц, чтобы доказать, насколько модели Stable Diffusion различаются от реальных случаев. ## Результаты Мы обнаружили, что Stable Diffusion XL генерирует изображения с значительно более темной кожей и меньшей красностью, чем предыдущие версии или даже реальные лица. Это уровень темноты кожи, который может сильно усиливать стереотипы по расовой принадлежности. Модель XL также показывает меньшую разнообразность в цвете кожи по сравнению с другими моделями и даже с реальными нормальными лицами. Например, 60,29% стigmatизированных идентификаторов были изображены с меньшей разнообразностью кожными тонами по сравнению с нестigmatизированными. Более того, Stable Diffusion XL гораздо более часто генерирует изображения с одним и тем же цветом кожи для разных стigmatизированных идентификаторов, что усиливает стереотип о том, что люди разных рас имеют одинаковые цвета кожи. ## Значимость Эти результаты имеют важное значение в области искусственного интеллекта, компьютерного зрения и социальных сетей. Stable Diffusion XL широко используется для построения изображений и текстов, и его способность генерировать более стереотипные изображения может ускорить проблемы, связанные с расу и социальным равенством. Мы также показали, что во время процесса обучения модели генерируются менее разнообразные изображения с темным цветом кожи, что может привести к углублени
Annotation:
Text-to-image generators (T2Is) are liable to produce images that perpetuate social stereotypes, especially in regards to race or skin tone. We use a comprehensive set of 93 stigmatized identities to determine that three versions of Stable Diffusion (v1.5, v2.1, and XL) systematically associate stigmatized identities with certain skin tones in generated images. We find that SD XL produces skin tones that are 13.53% darker and 23.76% less red (both of which indicate higher likelihood of societal ...
ID: 2508.17465v1 cs.CY, cs.AI, K.4.2
Авторы:

Marie Mirsch, Laila Wegner, Jonas Strube, Carmen Leicht-Scholten

## Контекст Область исследования — алгоритмическая справедливость с использованием интерсекциональной теории. Данная область направлена на изучение того, как современные алгоритмические системы могут определять и даже усиливать системные неравенства, особенно для интерсекционально опознаваемых групп. Недавние подходы к алгоритмической справедливости часто ограничиваются одномерными (single-axis) или формальными фреймворками, которые не учитывают сложные интерсекциональные динамики. Это приводит к переопределению или игнорированию структурных неравенств. Мотивация заключается в развитии более глубокого понимания, как алгоритмы могут быть значительно улучшены для учитывания социального контекста и устранения интерсекциональных неравенств. ## Метод Метод развивается на базе нового фреймворка Substantive Intersectional Algorithmic Fairness, построенного на теории значимой алгоритмической справедливости (Substantive Algorithmic Fairness) З. Грина. Методология включает в себя 10 ключевых требований (desiderata), ориентированных на проектирование и оценку алгоритмов, которые учитывают интерсекциональные динамики. Технические решения основываются на эмпирических данных, чтобы проверять, насколько алгоритмы способны учитывать социальные ранги, смешанные идентичности и группы людей с несколькими формами опричества. Архитектура метода — гибкая и включает в себя инструменты для оценки и прагматического применения алгоритмов на практике. ## Результаты В ходе исследования проведены эксперименты с использованием различных данных о различных группах и социальных идентичностях. На основе ROOF-методологии были измерены результаты алгоритмов на различных интерсекциональных критериях. Основной результат заключается в том, что алгоритмы, которые не учитывают интерсекциональные динамики, могут усиливать неравенство, в то время как новый фреймворк позволяет создавать более справедливые и контекст-зависимые решения. Например, одни из результатов показывают, что некоторые группы могут быть незаметно исключены из результатов, пока другие получают преимущества. ## Значимость Полученные результаты имеют широкое применение в сферах, где алгоритмы используются для принятия решений в области работодательской справедливости, финансовых систем, здравоохранения и образования. Основное преимущество — учетом интерсекциональных динамик в процессе разработки алгоритмов. Это влечет за собой повышение справедливости, уменьшение вреда для интерсекционально опознаваемых групп и повышение общей эффективности систем. Будущие исследования могут сосредоточиться на расширении теоретичес
Annotation:
Intersectionality has profoundly influenced research and political action by revealing how interconnected systems of privilege and oppression influence lived experiences, yet its integration into algorithmic fairness research remains limited. Existing approaches often rely on single-axis or formal subgroup frameworks that risk oversimplifying social realities and neglecting structural inequalities. We propose Substantive Intersectional Algorithmic Fairness, extending Green's (2022) notion of sub...
ID: 2508.17944v1 cs.CY, cs.AI
Авторы:

Adil Bahaj, Mohamed Chetouani, Mounir Ghogho

#### Контекст В последние годы большое внимание уделяется развитию здравоохранения через искусственный интеллект (ИИ). Одной из ключевых областей применения ИИ является медицина, где ИИ применяется для диагностики, решения медицинских вопросов и повышения справочного обслуживания. Однако существуют серьезные проблемы, особенно в отношении моделей большого языкового моделирования (LLM) и визуального моделирования (VLMs). Эти модели часто демонстрируют систематическую предрасположенность, в том числе возрастную предрасположенность, что снижает их достоверность и справедливость. Это особенно важно в области педиатрии, где здоровье детей часто остается забытым или менее изученным, несмотря на высокий бремен детских заболеваний. Для решения этой проблемы был представлен новый бенчмарк PediatricsMQA, предлагающий новые возможности для тестирования ИИ в области педиатрии. #### Метод Представленный бенчмарк PediatricsMQA является многомерным и включает 3,417 текстовых вопросов с множественным выбором (MCQ), покрывающих 131 педиатрических тем в разных стадиях развития, от предпородного развития до подросткового возраста. Бенчмарк также включает 2,067 визуальных вопросов, использующих 634 педиатрических изображений в различных модальностях и охватывающих 256 анатомических регионов. Методология создания бенчмарка включала в себя сочетание ручных и автоматизированных подходов. Использовались данные из периодической педиатрической литературы, валидированные банки вопросов, существующие бенчмарки и другие ресурсы. Это позволило создать богатый набор данных, который покрывает широкий спектр педиатрических вопросов и изображений. Этот подход обеспечивает высокую разнообразность и глубину вопросов, чтобы обеспечить точную и эффективную оценку моделей. #### Результаты Были проведены эксперименты с использованием современных моделей ИИ, включая LLM и VLMs. Результаты показали, что производительность этих моделей существенно снижается при работе с вопросами, касающимися моложества. Это особенно заметно в младших возрастных группах, где модели демонстрируют на порядок выше старших групп. Эти результаты подтверждают существующие проблемы с возрастной предрасположенностью в AI-моделях и подчеркивают необходимость развития адаптивных методов, которые могут учитывать различия в возрасте. Бенчмарк также показал существенные различия в производительности в зависимости от типа вопроса (текст vs. визуальное изображение), что дает дополнительные возможности для расширения ИИ в пе
Annotation:
Large language models (LLMs) and vision-augmented LLMs (VLMs) have significantly advanced medical informatics, diagnostics, and decision support. However, these models exhibit systematic biases, particularly age bias, compromising their reliability and equity. This is evident in their poorer performance on pediatric-focused text and visual question-answering tasks. This bias reflects a broader imbalance in medical research, where pediatric studies receive less funding and representation despite ...
ID: 2508.16439v2 cs.CY, cs.AI, cs.CL, cs.GR, cs.MM
Авторы:

Johannes Schleiss, Anke Manukjan, Michelle Ines Bieber, Sebastian Lang, Sebastian Stober

## Контекст В последние годы роль искусственного интеллекта (AI) в профессиональной сфере становится важной, что приводит к необходимости внедрения компетенций по AI в высшее образование. Однако к проблемам внедрения AI в образовательные программы существует ограниченная исследовательская база, которая вызовает потребность в новых формах сотрудничества между дисциплинами. Учебные программы по AI в инженерной сфере являются особенно сложными, так как требуется комбинация современных технологий с прикладными принципами инженерии. В данном исследовании адресуется эта проблема, рассматривая перспективы развития интердисциплинарных программ по AI в инженерии. Основной фокус — на программе подготовки инженеров специализирующихся в области AI. Работа основывается на методологии, включающей как квантитативный анализ, так и групповые интервью. Цель — оценить соответствие целевым компетенциям, качество, согласованность, практичность и эффективность программы с обеих сторон — учебного и профессионального. ## Метод Исследование основывается на методологии, которая объединяет квантитативный и квалитативный подход. Анализ используется для оценки карты учебной программы с целью изучения соответствия целевым компетенциям. Данные получены с помощью групповых интервью с участием экспертов из области AI и инженерии. Выборка включает как разработчиков программы, так и их неучастников, что позволяет понять различия в представлении качества и эффективности. Этот метод позволяет выявить слабые места в подготовке программы и определить особенности интердисциплинарного подхода в образовании. ## Результаты Изучение программы показало, что она в целом соответствует целям, но есть узкие места, связанные с неоднозначностью в определении некоторых технических компетенций. Эксперты отмечают высокий уровень качества и согласованности, однако указывают на необходимость улучшения практичности. Результаты также показывают, что участие разработчиков в программе повышает их оценку качества, но может привести к несогласию с неучастниками. Также выявлено, что практические аспекты и выгоды для отрасли имеют более высокий приоритет для профессионалов, чем для учёных. ## Значимость Результаты имеют практическое значение как для учёных, так и для профессионалов. Интердисциплинарный подход позволяет создавать программы, которые будут отвечать точным потребностям отрасли. Данная работа может стать референтным пунктом для дальнейшего развития программ по AI в образовательных учреждениях. Также она подчёркивает значение участия разработчиков и про
Annotation:
As Artificial Intelligence (AI) increasingly impacts professional practice, there is a growing need to AI-related competencies into higher education curricula. However, research on the implementation of AI education within study programs remains limited and requires new forms of collaboration across disciplines. This study addresses this gap and explores perspectives on interdisciplinary curriculum development through the lens of different stakeholders. In particular, we examine the case of curr...
ID: 2508.14921v1 cs.CY, cs.AI
Авторы:

Shayan Bafandkar, Sungyong Chung, Homa Khosravian, Alireza Talebpour

## Контекст Engineering education исторически ограничивается стандартизированными фреймворками, не учитывающими разнообразие студенческих потребностей и интересов. Несмотря на прогресс в области онлайн-образования в K-12 и фундаментальных науках, инновации в обучении инженеров на уровне бакалавриата и магистратуры остаются редкостью. Традиционные методы оценки, такие как экзамены и домашние задания, часто не учитывают индивидуальных нужд студентов, что мешает созданию персонализированных образовательных опытов. Для решения этих проблем предлагается Personalized AI-Powered Progressive Learning (PAPPL), расширенная система интеллектуального преподавания (ITS), ориентированная на обеспечение индивидуальной поддержки в обучении инженеров. ## Метод PAPPL основывается на современных технологиях AI, включая LLM GPT-4o, для построения сценариев обучения, адаптированных к контексту. Оно включает в себя модули: экспертный модуль, студенческий модуль, модуль преподавателя и пользовательский интерфейс. Платформа анализирует попытки студентов, выявляет повторяющиеся недопонимания и формирует динамические, учитывающие прогресс, фидбек. Она также предоставляет преподавателям аналитические инструменты для оптимизации реакций на потребности студентов. Эта разработка является почву для развития ITS, которая может быть масштабирована для различных уровней образования. ## Результаты Экспериментальные тесты PAPPL показали, что онлайн-обучение поддерживает персонализацию и стимулирует прогресс. Анализ данных подтверждает эффективность индивидуального подхода к обучению. Студенты, использующие PAPPL, показали улучшения в понимании концепций и прогресс в решении задач, чем те, кто поreлачивался с традиционными методами. ## Значимость PAPPL может применяться в STEM-образовании и за его пределами, обеспечивая динамичность и систематическую поддержку. Оно предоставляет преимущества в улучшении обучения, аналитики и отслеживании прогресса. В будущем могут проводиться исследования по расширению функциональности и интеграции новых AI-технологий для еще более эффективного обучения. ## Выводы PAPPL достигает прогресса в области Generative ITS, показывая возможности для развития образовательных систем. Будущие исследования должны сфокусироваться на масштабировании, интеграции новых технологий и улучшении интерактивности для широкого использования в образовательных процессах.
Annotation:
Engineering education has historically been constrained by rigid, standardized frameworks, often neglecting students' diverse learning needs and interests. While significant advancements have been made in online and personalized education within K-12 and foundational sciences, engineering education at both undergraduate and graduate levels continues to lag in adopting similar innovations. Traditional evaluation methods, such as exams and homework assignments, frequently overlook individual stude...
ID: 2508.14109v1 cs.CY, cs.AI, cs.ET
Авторы:

Lameck Mbangula Amugongo, Nicola J Bidwell, Joseph Mwatukange

## Контекст Только 15% из 700 миллионов мобильных подключений в Африке принадлежат детям, но число их программных приложений в Андроид-магазине растет вдвое быстрее, чем в любой другой регионе. Этот динамический рост мобильных технологий сформировал новый контекст для экспериментального изучения уровня доверия к искусству искусственного интеллекта (AI) в Африке. Несмотря на важность доверия в AI, существуют существенные различия в понимании этого понятия между индустрией, наукой и политическими сферами. Для профессионалов, разрабатывающих и использующих AI, доверие к системам AI часто определяется социальными отношениями и опытом в рабочей среде. Многие исследования посвящены конструктам доверия в AI (например, надежность, доступность и ответственность), однако большинство из них ориентированы на Западные, Образованные, Индустриализированные, Богатые и Демократические (WEIRD) общества. Минимум исследований, которые коснулись доверия к AI в Африке, не включают в себя мнения тех, кто разрабатывает, изучает или применяет AI в своей работе. Данная исследовательская работа ставит целью проанализировать, каким образом профессионалы в Африке рассматривают доверие к AI, а также определить, какие факторы влияют на их взгляды. ## Метод Для получения данных был проведен онлайн-опрос 157 профессионалов и студентов AI из 25 африканских стран. Участники представляли собой разнообразные специалистов, включая ученых, разработчиков, исследователей и студентов, связанных с темой AI. Данные были собраны с использованием опросника, содержащего вопросы, раскрывающие представления участников о доверии к AI. Ответы были проанализированы с помощью теоретического разбора текста, который позволил выделить темы и мотивы, связанные с доверием к AI. Данные также были проверены на наличие социальных и культурных факторов, которые могли повлиять на ответы. ## Результаты Опрос показал, что доверие к AI в Африке определяется рядом культурных и социальных факторов. Участники часто ссылались на ценности, приобретенные в сообществе, в котором выросли, подчеркивая общественные отношения вместо индивидуальных свобод. Они определяли доверие разными способами, включая применение концепций Afro-relationalism к международным понятиям, таким как надежность и зависимость. Несколько частых тем, выделенных в исследовании, включали в себя аспекты, связанные с надежностью, доступностью, безопасностью и ответственностью AI-систем. Также была выявлена тенденция к выражению беспокойства по поводу потенциаль
Annotation:
The trustworthiness of AI is considered essential to the adoption and application of AI systems. However, the meaning of trust varies across industry, research and policy spaces. Studies suggest that professionals who develop and use AI regard an AI system as trustworthy based on their personal experiences and social relations at work. Studies about trust in AI and the constructs that aim to operationalise trust in AI (e.g., consistency, reliability, explainability and accountability). However, ...
ID: 2508.14116v1 cs.CY, cs.AI
Авторы:

Mackenzie Jorgensen, Kendall Brogle, Katherine M. Collins, Lujain Ibrahim, Arina Shah, Petra Ivanovic, Noah Broestl, Gabriel Piles, Paul Dongha, Hatim Abdulhussein, Adrian Weller, Jillian Powers, Umang Bhatt

## Контекст Современное общество сталкивается с постоянным ростом интеграции искусственного интеллекта (ИИ) в различные сферы жизнедеятельности, включая финансовые услуги, управление трафиком и даже творческое писььмо. Несмотря на это, академическая литература в основном сосредоточена на описании рисков и вредных последствий, связанных с использованием ИИ. Это создает необходимость в подробном изучении реальных сценариев развертывания ИИ и его государственных механизмов. Fabric — это открытый репозиторий, представляющий собой источник живых примеров развертывания ИИ в реальных условиях. Этот проект нацелен на изучение существующих практик, моделей управления и создания инструмента для изучения эффективности управления ИИ в различных сферах. ## Метод Методология проекта Fabric основывается на собеседованиях с практиками в области развертывания ИИ, стремящихся понять, какие методы используются на практике для государственного управления. В ходе собеседований, проводимых в формате полуструктурированных интервью, собираются данные о 20 разных сценариях развертывания ИИ. Также, в сотрудничестве с практиками, были разработаны визуальные диаграммы, отображающие рабочие процессы ИИ. Интервью позволяют понять, какие меры государственного управления и защитных механизмов применяются в реальных условиях для обеспечения безопасности и эффективности развертываемых ИИ-систем. ## Результаты Репозиторий Fabric содержит визуальные диаграммы, описывающие рабочие процессы ИИ в различных сферах, а также подробные описания каждого сценария развертывания. Эксперименты показали, что существует различные формы государственного управления и защитных механизмов, применяемых в разных контекстах. Наиболее распространенными практиками являются: мониторинг, аудит и ограничения ресурсов. Эти методы позволяют управлять рисками и оптимизировать эффективность развертывания ИИ-систем. Были выявлены общие закономерности в практиках управления ИИ, включая частое применение ручных процессов в мониторинге и аудите систем. ## Значимость Представленный репозиторий Fabric может быть использован в различных областях, включая научные исследования по оценке эффективности государственного управления ИИ, разработку новых моделей управления и создание инструментов для анализа существующих практик. Он выделяет главные проблемы в сфере государственного управления ИИ и предоставляет инструментарий для их решения. Кроме того, Fabric может способствовать развитию новых практик и стратегий для обес
Annotation:
Artificial intelligence (AI) is increasingly integrated into society, from financial services and traffic management to creative writing. Academic literature on the deployment of AI has mostly focused on the risks and harms that result from the use of AI. We introduce Fabric, a publicly available repository of deployed AI use cases to outline their governance mechanisms. Through semi-structured interviews with practitioners, we collect an initial set of 20 AI use cases. In addition, we co-design...
ID: 2508.14119v2 cs.CY, cs.AI, cs.HC
Показано 221 - 230 из 282 записей