📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Truong Thanh Hung Nguyen, Tran Diem Quynh Nguyen, Hoang Loc Cao, Thi Cam Thanh Tran, Thi Cam Mai Truong, Hung Cao

## Контекст Успех в современном бизнесе часто зависит от способности представителей компаний вести эффективные интервью. Однако классические методы обучения в этой области часто являются стандартизированными и не учитывают индивидуальные особенности кандидатов, а также культурные и языковые различия. Это приводит к проблемам в подготовке бизнес-профессионалов, особенно в условиях международных рынков. Недостаток индивидуального подхода приводит к неэффективности подготовки и несоответствию требованиям рынка. Таким образом, возникает необходимость в разработке систем, которые могут предоставить индивидуальную, культурно осознанную и практически читаемую подготовку к бизнес-интервью, учитывая различия в языках и культурах. ## Метод SimInterview представляет собой LLM-based simulated multilingual interview training system, основанный на трёх основных компонентах: 1. **Large Language Model Agent (LLM-agent)**: Он управляет всеми интерактивными задачами, в том числе вопросами, ответами, синтезом речи и разговорным моделированием. 2. **Synthetic AI Technologies**: Используются для моделирования реалистичных виртуальных рекрутеров. 3. **Retrieval-Augmented Generation (RAG)**: Этот подход адаптирует сценарии интервью к конкретным резюме кандидатов и требованиям к позиции. Система использует модели LLMs, такие как OpenAI o3, Llama 4 Maverick и Gemma 3, для обработки текста и генерации говорящих агентов. Она также интегрирует Whisper для распознавания речи, GPT-SoVITS для синтеза речи и Ditto для генерирования говорящих голов. Данные хранятся в ChromaDB в виде векторных баз данных. ## Результаты В ходе экспериментов с участием университетских кандидатов SimInterview показал высокую точность в оценке интервью и высокую удовлетворенность пользователей. Он выдал точные результаты в многоязычной среде (английский и японский), где пользователи особенно ценили то, как система сохраняла индивидуальность кандидатов и учёла культурные различия. Например, японский формат резюме был лучше захвачен со всеми важными деталями, тогда как разнообразие английских резюме привносило более высокий уровень сложности и вариативности в процессе. ## Значимость SimInterview может применяться в области обучения мягким навыкам, глобализации бизнеса и работе с многократной культурой. Он предоставляет выгоды в виде точной индивидуальной подготовки, гибкости в работе с разными культурами и языками, а также высокой точности во взаимодействии. Это может стать ключевым инструментом для успешной карьерной подготовки в международных компаниях. ## Выводы Разработанная система продемонстрировала успех в
Annotation:
Business interview preparation demands both solid theoretical grounding and refined soft skills, yet conventional classroom methods rarely deliver the individualized, culturally aware practice employers currently expect. This paper introduces SimInterview, a large language model (LLM)-based simulated multilingual interview training system designed for business professionals entering the AI-transformed labor market. Our system leverages an LLM agent and synthetic AI technologies to create realist...
ID: 2508.11873v1 cs.CY, cs.AI, cs.HC, cs.MM
Авторы:

Surajit Das, Aleksei Eliseev

#### Контекст Generative AI, особенно в сфере образования, стал спогадой изменившегося представления о роли технологий в учебных процессах. Развитие инструментов, таких как ChatGPT, вызвало острые дебаты о том, насколько они приносят пользу или портят классический подход к обучению. Несмотря на то, что существуют работы, показывающие потенциальные преимущества технологий в учебных задачах, недостаточно данных о том, в каких ситуациях студенты используют их в реальной жизни, как при подготовке к заданиям. Однако понимание этого вопроса является ключевым для развития новых методов оценки и разработки инновационных подходов к использованию AI в образовании. #### Метод Для данного исследования были проанализированы ответы 388 студентов, в основном из России, с добавлением небольшого количества участников из других стран. Использовались данные, собранные через онлайн-сервисы, чтобы изучить связь между характером пользования ChatGPT и учебными характеристиками. Моделирование было проведено с помощью XGBoost, разработанного для точного предсказания поведения студентов при подготовке к заданиям. Для его тренировки использовались классические методы кросс-валидации и финальная оценка на отложенных данных. #### Результаты Проведенный предиктивный классификатор показал себя весьма эффективно. Бинарный классификатор смог достичь 80.1% точности, при том, что его показатели сенситивности и специфичности составили 80.2 и 79.9% соответственно. Многоклассовый классификатор, напротив, имел 64.5% точности, но с его характеристиками показатели весовой точности и рекурсии схожи с бинарным, что может свидетельствовать о нехватке данных. Отдельное внимание заслуживает тематический анализ, который выявил, что частые попытки использования ChatGPT для освоения новых знаний могут привести к риску перегрузки и уменьшения самостоятельности. #### Значимость Результаты этого исследования показывают, что генерируемые средства AI, такие как ChatGPT, могут приносить вклад в образовательные процессы, но при этом есть риск ухудшения критического мышления и творчества у студентов. Эти находки могут помочь формировать новые стратегии оценки и разработку подходов к интеграции AI в образовательные процессы, основываясь на принципах этики и равенства. #### Выводы Основным достижением этого исследования является понимание, что применение AI в образовательных задачах должно быть тщательно контролируемо. Нужно разрабатывать дисциплинарные рекомендации и переосмыслить стратегии оценки, чтобы обеспечить баланс между инновационными возможностями AI и требованиями к высоко
Annotation:
The rise of generative AI tools like ChatGPT has significantly reshaped education, sparking debates about their impact on learning outcomes and academic integrity. While prior research highlights opportunities and risks, there remains a lack of quantitative analysis of student behavior when completing assignments. Understanding how these tools influence real-world academic practices, particularly assignment preparation, is a pressing and timely research priority. This study addresses this gap ...
ID: 2508.12013v1 cs.CY, cs.AI
Авторы:

Vladimir Maksimenko, Qingyao Xin, Prateek Gupta, Bin Zhang, Prateek Bansal

#### Контекст Сокращение углеродных выбросов является ключевым аспектом борьбы с климатическими изменениями. Одним из важных видов выбросов является сектор авиации, где потребители часто не ориентируются на возможность компенсации углеродных выбросов ваших поездок. Научные исследования показывают, что nudge-стратегии, которые используются для поощрения экологичных поведений, могут быть эффективными, но их результативность зависит от конкретных предпочтений индивидуума. Большинство работ в этой области основываются на традиционных методах, работающих с широкими общими предпочтениями. Это приводит к неэффективности в случае тонкого рассмотрения индивидуальных мотиваций. Мы же предлагаем использовать **Large Language Models (LLMs)**, которые могут эмулировать человеческую работу над поощрением с помощью personalized nudge-стратегий, не требуя огромных данных об индивидуальном поведении. Цель нашей исследовательской работы — показать, как эти модели могут быть применены в секторе авиации для повышения участия в программах компенсации углеродных выбросов. #### Метод Мы используем **LLM-модели**, которые основываются на анализе текстов и могут генерировать personalized nudges на основании определенных потребностей и предпочтений пользователей. Мы разрабатываем **decoy-based nudge strategies**, которые предлагают различные варианты компенсации для пользователей в зависимости от их поведения и предпочтений. Модели LLMs обучены по данным из пяти стран, включая Китай, Германию, Индию, Сингапур и США, что дает возможность понять локальные мотивации и предпочтения. Для проверки эффективности нашей модели, мы проводим опросы среди **3495 участников**, чтобы измерить эффективность нашего подхода по сравнению с традиционными методами. Это позволяет нам оценить, на сколько эффективнее ЛЛМы в подтягивании внимания к проблеме и в повышении участия в компенсационных программах. #### Результаты Наши эксперименты показали, что **personalized nudges**, созданные с помощью LLMs, значительно эффективнее **uniform nudge-стратегий**. Они повышают процент людей, желающих компенсировать свои выбросы, на 3–7%, что приводит к повышению участия в программах компенсации. Этот подход особенно эффективен в случае с **скептическими пользователями**, которые, как правило, не доверяют программам компенсации. Мы также выявили, что LLM-модели увеличивают общую сумму CO$_2$, которая может быть компенсирована в связи с этим подходом. На ежегодной основе это приводит к дополнительной компенсации **2.3 миллионов тонн CO$_2$** в авиации, что является значительным улучшением в стремлении к уменьшению углеродных выбросов.
Annotation:
Nudge strategies are effective tools for promoting sustainable behaviour, but their impact depends on individual preferences. By emulating human decision-making, large language models (LLMs) offer a cost-effective route for tailoring nudges without extensive behavioural datasets, yet this potential remains unexplored. Focusing on aviation, we use LLMs to design personalized decoy-based nudge strategies that encourage air travellers to voluntarily offset CO$_2$ emissions from flights, and validat...
ID: 2508.12045v1 cs.CY, cs.AI
Авторы:

Gilad Abiri

## Контекст В последние несколько лет глобальное сообщество сталкивается с вопросами безопасности и регулирования искусственного интеллекта (ИИ). Эти вопросы возникают в условиях международной конкуренции, где страны стремятся получить привлекательные позиции в развитии ИИ. Нации часто решают подчинить безопасность развитию, убежденные в том, что убирая безопасностные ограничения, можно добиться более быстрого прогресса. Этот подход, называемый "регуляционной отдачей" (Regulation Sacrifice), стал широко обсуждаемым в мировой политике. Однако, хотя он может показаться привлекательным, он имеет серьезные недостатки. Основной мотивацией для этого исследования является понимание, почему страны отказываются от регулирования и какие опасности это создает для безопасности в будущем. ## Метод Для данного исследования была применена комбинация литературного анализа, экономического моделирования и сравнительного анализа поведения государств. Одной из основных технических решений было использование анализа статистических данных по развитию ИИ в разных странах. Для моделирования эффектов регуляционной отдачи разработана и использована модель ситуационной игры (game theory model), позволяющая проанализировать международные стратегии в области регулирования. Также, была проведена сравнительная интроспекция, в которой проанализированы политические решения отдельных стран для понимания мотиваций и последствий. ## Результаты На основе проведенных экспериментов и моделирования, было выявлено несколько основных результатов: 1. **Скорость распространения технологий**: Анализ показал, что преимущества в ИИ между центрами развития сильно сокращаются в течение нескольких месяцев. Например, разница в производительности между системами ИИ США и Китая сократилась с 9% до 2% за 13 месяцев. Это свидетельствует о быстром распространении технологий, что делает нецелесообразным уничтожение безопасностных мер. 2. **Влияние регулирования на инновации**: Исследования показали, что хорошо спроектированное регулирование может стимулировать инновации. Например, в рамках сравнения стран, в которых имеются четкие нормативные ритейлы для развития ИИ, было отмечено, что такие страны имеют более высокую скорость развития. Это продемонстрировано на примере стран, где развитие автомобилей электронных транспорта было стимулировано через регулирование. 3. **Безопасность на разных сроках**: Эксперименты показали, что снятие безопасностных мер может привести к негативным последствиям в ближайшем, среднем и долгосрочном периодах. В ближайш
Annotation:
We have convinced ourselves that the way to make AI safe is to make it unsafe. Since 2022, policymakers worldwide have embraced the Regulation Sacrifice - the belief that dismantling safety oversight will deliver security through AI dominance. Fearing China or USA will gain advantage, nations rush to eliminate safeguards that might slow progress. This Essay reveals the fatal flaw: though AI poses national security challenges, the solution demands stronger regulatory frameworks, not weaker ones. ...
ID: 2508.12300v1 cs.CY, cs.AI
Авторы:

Greg Sadler, Nathan Sherburn

## Контекст Область исследования, связанная с рисками, связанными с передовыми системами ИИ, находится в центре внимания вследствие сложностей, связанных с моделированием и предсказанием поведения систем, которые могут влиять на широкий круг субъектов. Одной из ключевых проблем является недостаточная подготовка к нестандартным рискам, которые могут возникнуть в силу специфических особенностей этих систем. Ранее установленные меры противодействия не всегда могут справиться с такими угрозами, поскольку они часто основываются на предположении о природе знакомых угроз. Было выделено, что существуют специфические, неизвестные для настоящего момента риски, которые могут исходить от взаимодействия систем с человеческими структурами, в том числе правовыми и регулирующими. В этом контексте вводится понятие "Legal Zero-Days" — незамеченные ранее уязвимости в правовых системах, которые могут быть использованы для непосредственного повреждения общественных структур или достижения высокого степени воздействия. Данная работа призвана исследовать этот новый вид риска, определив его характеристики и потенциальные последствия. ## Метод Методология исследования основывается на создании модели риска, рассматривающей "Legal Zero-Days" как угрозу, которая не требует традиционных процедур, таких как юридическая процедура или регуляторное вмешательство, для воздействия. Технические решения включают детальный анализ юридических фреймворков и исторических случаев, например, анализ кризиса с двойными гражданствами в Австралии в 2017 году. Архитектура исследования включает в себя разработку "юридических головоломок" — ситуаций, которые подразумевают тестирование систем ИИ на способность выявлять и оценивать такие уязвимости. Исследование также включает моделирование сценариев, в которых такие уязвимости могут быть использованы для преднамеренного воздействия. ## Результаты Исследование показало, что текущие системы ИИ не достаточно эффективны в выявлении "Legal Zero-Days". На основе случая с двойными гражданствами в Австралии было установлено, что незначительные ошибки в юридических рамочных документах могут привести к значительным последствиям. Однако, в отличие от ситуаций с классическими уязвимостями, эти уязвимости не всегда могут быть доступны для обычных методов оценки. Исследование также выявило, что развитие ИИ может привести к улучшению способности систем к выявлению таких уязвимостей, но это также создает риск того, что вредоносные субъекты могут использовать подобные методы для злонамеренных целей. ## Значимо
Annotation:
We introduce the concept of "Legal Zero-Days" as a novel risk vector for advanced AI systems. Legal Zero-Days are previously undiscovered vulnerabilities in legal frameworks that, when exploited, can cause immediate and significant societal disruption without requiring litigation or other processes before impact. We present a risk model for identifying and evaluating these vulnerabilities, demonstrating their potential to bypass safeguards or impede government responses to AI incidents. Using th...
ID: 2508.10050v1 cs.CY, cs.AI
Авторы:

Jay L. Cunningham, Kevin Zhongyang Shao, Rock Yuren Pang, Nathaniel Mengist

## Контекст В последние годы в сфере искусственного интеллекта (ИИ) наблюдается возрастающий интерес к вопросам уравновешивания и улучшения эквити (данное понятие можно определить как справедливость и сплоченность в процессе развития и применения технологий ИИ). Особое внимание уделяется естественному языку обработки (NLP), где проблемы негативного влияния моделей ИИ на различные социальные группы становятся все более заметными. Несмотря на то, что много работ посвящено выявлению и анализу алгоритмической стереотипности, меньше внимания уделяется вопросу о том, как практикующие NLP-специалисты (например, те, кто занимается созданием, аннотацией и развертыванием данных) воспринимают проблемы эквити в процессе работы с данными NLP. Этот исследовательский подход становится ключевым для понимания ключевых проблем в области ИИ и для формирования решений, которые могут влиять на будущие технологические развития. ## Метод Работа основывается на опросе, проведенном в 2024 году, и на материалах фокус-группы. Основной акцент в подходе делается на исследование представлений и практик U.S.-based NLP-практиков, которые занимаются работой над данными, аннотацией и развертыванием моделей. Центральное внимание уделяется пониманию того, как эти специалисты понимают понятие "справедливости" в ИИ, какие вызовы и ограничения они сталкиваются в своей работе, и каким образом они взаимодействуют с новыми подходами к государственному управлению, такими как У.С. AI Bill of Rights. Методология исследования включает в себя анализ ответов, проведение интервью и использование концепции многоуровневого кадра государственного управления (multi-scalar AI governance framework), который позволяет выявить связь между техническими аспектами, политическими решениями и социальными запросами. ## Результаты На основе проведенных исследований были выявлены несколько основных находок. Во-первых, существует значительное расхождение между коммерческими целями и приверженностью к принципам справедливости в NLP-данных. Во-вторых, NLP-практикующие сталкиваются с ограничениями в работе, включая системные ограничения, организационные барьеры и технические затруднения. Несмотря на это, они призывают к более участительным и ответственным подходам к работе с данными, чтобы обеспечить более честную и справедливую систему. Третьим основным результатом является появление вызовов для нормативных подходов: практикующие NLP-специалисты выражают интерес к внедрению таких мер, как У.С. AI Bill of Rights, но при этом выделяют необходимость в более широком участии сообщества и более четкой струк
Annotation:
While research has focused on surfacing and auditing algorithmic bias to ensure equitable AI development, less is known about how NLP practitioners - those directly involved in dataset development, annotation, and deployment - perceive and navigate issues of NLP data equity. This study is among the first to center practitioners' perspectives, linking their experiences to a multi-scalar AI governance framework and advancing participatory recommendations that bridge technical, policy, and communit...
ID: 2508.10071v1 cs.CY, cs.AI, cs.HC
Авторы:

Wilder Baldwin, Sepideh Ghanavati, Manuel Woersdoerfer

## Контекст В последние годы развитие искусственного интеллекта (AI) привело к растущему интересу к вопросам этики и управления рисками. AI применяется в различных сферах, от здравоохранения до финансовых услуг, и потенциально может привести к ущербу, если не будут налажены контрольные меры. Однако существуют различия во взглядах на этические стандарты, зависящие от региона, профессионального опыта и других факторов. Необходимо понять эти различия, чтобы разработать универсальные, но гибкие решения, подходящие для различных структур и контекстов. Целью настоящего исследования является изучение этических практик и представлений у различных участников жизненного цикла развития AI. ## Метод Для изучения этических практик была проведена смешанная методологическая структурная анкетная исследовательская методика. Опросник включал в себя вопросы, опробованные на 115 испытуемых, а затем распространенные среди 414 участников из 43 стран. Участники выбирались по профессиональным ролям: менеджеры AI, аналитики, разработчики, тестировщики и специалисты по информационной безопасности и конфиденциальности. Метод реализовался в виде сочетания статистической и текстовой аналитики, чтобы объединить статистические тренды с глубинным пониманием текстовых ответов. Это позволило увидеть тенденции и уникальные характеристики социальных групп. ## Результаты Исследование показало, что участники имели разные уровни знаний и опыта в области этики AI. Например, руководители часто были более знакомы с рисками и государственными инициативами по этике, чем разработчики. Региональные различия также были заметны, например, участники из Европы более часто упоминали нормативные требования, чем их коллеги из Азии. Также были обнаружены различия во взглядах на угрозы, связанные с AI, в зависимости от роли участника. Эти результаты подтверждают необходимость различных подходов, которые учитывают различия в ролях, регионах и других факторах. ## Значимость Результаты имеют значимую значимость в нескольких областях. Во-первых, они могут быть использованы для разработки инструментов и процессов, которые гарантируют соблюдение этических стандартов в различных структурах. Во-вторых, результаты могут помочь учитывать различия в регионах и профессиональных группах при разработке международных стандартов. В-третьих, полученные данные могут способствовать развитию образовательных программ и стандартов, обучающих разработчиков к этическим вопросам с момента начала карьеры. Это вк
Annotation:
Recent advances in AI applications have raised growing concerns about the need for ethical guidelines and regulations to mitigate the risks posed by these technologies. In this paper, we present a mixed-method survey study - combining statistical and qualitative analyses - to examine the ethical perceptions, practices, and knowledge of individuals involved in various AI development roles. Our survey includes 414 participants from 43 countries, representing roles such as AI managers, analysts, de...
ID: 2508.09219v1 cs.CY, cs.AI, cs.HC, cs.SE
Авторы:

Yuan Yuan, Tina Sriskandarajah, Anna-Luisa Brakman, Alec Helyar, Alex Beutel, Andrea Vallone, Saachi Jain

########################## ## Контекст ########################## Лучшие в классе технологии ИИ, такие как ChatGPT, на основе бо LLM, широко используются в различных сферах, от образования до бизнеса. Однако существуют значительные проблемы, связанные с их безопасностью. Например, некоторые запросы могут быть адресованы не только для получения полезных ответов, но и для злонамеренных целей. В связи с этим, существуют трудности в обеспечении безопасности моделей, особенно при работе с запросами, имеющими двойственные значения. Традиционно, модели LLM обучаются определять порог отказа: либо выполняют запрос, либо отказываются от него. Этот подход эффективен в минимизации риска ответов, которые могут привести к вредоносным действиям. Однако он может привести к недостаткам в удобочитаемости, особенно при работе с запросами, имеющими неясную или двойственную цель. Эта слабость может привести к серьезным ошибкам в работе модели, особенно в областях, требующих высокой степени точности, таких как биология или кибербезопасность. Из этого рождается мотивация для разработки новых подходов к обучению моделей. Одним из таких подходов является safe-completion, который фокусируется на получении безопасных и полезных ответов, а не на определении порога отказа. Этот подход может сделать моделей более прочными и эффективными в работе с запросами, которые требуют более тонкого понимания цели пользователя. ########################## ## Метод ########################## Методология safe-completion основывается на том, чтобы модель при обработке запроса работала не только на основе цели пользователя, но и на основе выводимого ответа. Для этого вводятся специальные механизмы, которые позволяют модели оптимизировать ответ не только по понятию пользовательского ввода, но и по свойству ответа. Использовались различные методы обучения, включая методы градиентного спуска и методы глубокого обучения на логических задачах. Структура модели включает в себя несколько слоев нейронных сетей, которые работают вместе для процесса обучения. Модель обучалась на больших объемах данных, включающих как безопасные, так и возможно вредоносные запросы. Был разработан специальный алгоритм, который избегал традиционных подходов к определению порогов отказа и вместо этого сосредотачивался на оптимизации критериев безопасности и полезности ответа. Кроме того, для эффективного тестирования были применены различные методы эмпирической оценки, такие как метрики безопасности и метрики полезности ответа. Эти методы были использованы для оценки эффективности модели в различных сценариях, включая сценарии с двойственной целью запроса. ########################## ## Результаты ##########################
Annotation:
Large Language Models used in ChatGPT have traditionally been trained to learn a refusal boundary: depending on the user's intent, the model is taught to either fully comply or outright refuse. While this is a strong mitigation for explicitly malicious prompts, focusing safety training on refusals can lead to brittleness for prompts with obscured user intent. Binary refusal boundaries are especially ill-suited for dual-use cases (such as biology or cybersecurity), where a user request can be ans...
ID: 2508.09224v1 cs.CY, cs.AI, cs.CL
Авторы:

Ruchira Dhar, Stephanie Brandl, Ninell Oldenburg, Anders Søgaard

## Контекст Область Explainable AI (XAI) набирает обороты в поиске решений для того, чтобы сложные модели машинного обучения становились более понятными и интерпретируемыми для пользователей. Однако процесс создания эффективных и полезных объяснений является контекст-зависимым и требует учета конкретных потребностей и характеристик пользователей. Многие техники XAI фокусируются на технических аспектах, но недостаточно учитывают контекст выдачи объяснений. Это приводит к проблемам с доступностью, смыслом и учетом целей пользователей. Мотивация для работы лежит в желании переосмыслить процесс создания объяснений как контекст-зависимую дизайнерскую задачу, чтобы обеспечить более эффективное взаимодействие и понимание. ## Метод Работа предлагает трехуровневую модель для дизайна объяснений в XAI, основанную на принципах дизайн-синтерсии. Модель включает в себя три основных момента: **"Кто"** нуждается в объяснении, **"Что"** должно быть объяснено, и **"Как"** это объяснение должно быть сформулировано и доставлено. Для формирования объяснений рассматриваются различные аспекты, включая целевую аудиторию, ее задачи и контекст, в котором будет использовано объяснение. Также уделяется внимание этическим запросам, таким как эпистемическая неравенство, усиление социальных неравенств и затухание ответственности в разработке XAI. Это расширяет подход к XAI, превращая его в комплексный, контекст-зависимый процесс, учитывающий не только технические, но и социальные факторы. ## Результаты В рамках этой работы были проведены эксперименты, в которых применялись различные сценарии и сценарии использования XAI в разных сферах. Для оценки эффективности разработанного подхода были использованы различные наборы данных и ситуации, в которых требуется объяснение моделей. Результаты показали, что принципы, описанные в рамках модели, приводят к более четкому и информативному объяснению, а также позволяют улучшить интерактивность и понимание пользователями. Была выявлена связь между эффективностью объяснения и конкретными требованиями пользователей, а также ситуационными особенностями. ## Значимость Предложенная модель может быть применена в различных областях, включая здравоохранение, финансы, образование и другие, где сложные модели AI используются для принятия решений. Разработанный подход позволяет улучшить доступность и понятность моделей AI для разных пользователей, включая нетехнических. Он также поддерживает цели этичности, такие как уменьшение эпистемических неравенств и повышение ответственности в разрабо
Annotation:
The field of Explainable AI (XAI) offers a wide range of techniques for making complex models interpretable. Yet, in practice, generating meaningful explanations is a context-dependent task that requires intentional design choices to ensure accessibility and transparency. This paper reframes explanation as a situated design process -- an approach particularly relevant for practitioners involved in building and deploying explainable systems. Drawing on prior research and principles from design th...
ID: 2508.09231v1 cs.CY, cs.AI, cs.HC
Авторы:

Weina Jin, Ashish Sinha, Kumar Abhishek, Ghassan Hamarneh

## Контекст Область исследования Medical Image Synthesis (MISyn) направлена на создание имитационных медицинских изображений с целью поддержки обучения, диагностики и других медицинских задач. Однако существуют значительные проблемы, связанные с этическими аспектами развития и применения таких технологий. Одной из основных проблем является то, что синтетические изображения часто не имеют фундаментального анкеринга в реальных медицинских данных, что приводит к опасности их несоответствия реальности. Это может привести к введению новых биасов и расхождений, повлияв на качество диагностики или обучения моделей. Мотивация заключается в разработке эффективных методов уменьшения этих рисков, чтобы обеспечить безопасное и этичное применение MISyn в медицине. ## Метод Процесс разработки этических MISyn включает теоретический анализ основных свойств этических MISyn и их технических ограничений. Авторы проводят осмысление рисков, связанных с недостатком глубинного понимания слабых сторон синтетических изображений. Использоуется методология, основанная на анализе существующих технологий и стандартов, чтобы выявить пробелы в текущих практиках. Рекомендации по этичным практикам включают рекомендации по проектированию и оценке таких технологий, а также практики для надзора и контроля, вовлечения сторонних экспертов и публики. В кросс-чек-листе включены не только технические аспекты, но и моральные и социальные задачи. ## Результаты В результате серии экспериментов, в которых использовались различные медицинские данные и синтетическое синтезирование изображений, были выявлены слабые стороны синтетических данных. Авторы научились детально оценить такие метрики, как точность синтеза, надежность и возможность применения в медицине. Также были изучены сценарии, где синтетические данные приводят к завышенным ожиданиям или ошибочному использованию. Эти эксперименты позволили выявить риски, связанные с недостатком этической оценки и контроля в применении MISyn. ## Значимость Результаты имеют значительное значение для различных областей, включая медицинскую информатику, этическую искусственную интеллектуальную практику и широкий круг специалистов в области безопасного применения искусственных интеллектов в медицине. Преимуществом является создание более этичных и надежных методов, которые могут повысить доверие к медицинским изображениям и снизить риск дискриминации и неточностей в синтетических данных. Эти рекомендации могут привести к повышению качества и безопасности медицинского анализа, а также к созданию более
Annotation:
The task of ethical Medical Image Synthesis (MISyn) is to ensure that the MISyn techniques are researched and developed ethically throughout their entire lifecycle, which is essential to prevent the negative impacts of MISyn. To address the ever-increasing needs and requirements for ethical practice of MISyn research and development, we first conduct a theoretical analysis that identifies the key properties of ethical MISyn and intrinsic limits of MISyn. We identify that synthetic images lack in...
ID: 2508.09293v1 cs.CY, cs.AI
Показано 241 - 250 из 282 записей