📊 Статистика дайджестов
Всего дайджестов: 35039 Добавлено сегодня: 432
Последнее обновление: сегодня
Авторы:
Mohammadreza Daviran, Brian Lin, Davood Rafiei
#### Контекст
Текст-to-SQL системы предназначены для перевода запросов, написанных на естественном языке, в SQL-запросы для выполнения на базах данных. Однако существуют проблемы с адаптацией этих систем к новым базам данных с разными схемами. Допускаются ошибки в структуре и семантике запросов, что снижает удобство использования систем. `SQL-Exchange` — это инновационный подход, который предлагает новую модель для трансформации SQL-запросов между разными базами данных, сохраняя исходную структуру запросов и адаптируя их к новой схеме. Он исследует условия, при которых такие трансформации возможны и полезны, а также показывает, как эта технология может улучшить "in-context learning" для текст-to-SQL систем.
#### Метод
`SQL-Exchange` основывается на двух основных этапах: **стадию модификации** и **стадию адаптации**. В первой стадии идентифицируются и анализируются различия между исходной и целевой схемами, а затем исходный запрос адаптируется для соответствия новой схеме. Это достигается с помощью `schema mapping`, который сопоставляет элементы исходной схемы с элементами целевой схемы. Технический подход включает в себя графы схем, автоматическое сопоставление и корректировку структуры запросов. Таким образом, `SQL-Exchange` обеспечивает точное преобразование запросов, сохраняя семантику и функциональность.
#### Результаты
Исследователи провести эксперименты на множестве баз данных, схем, и запросов, чтобы проверить точность и эффективность `SQL-Exchange`. Данные в экспериментах включали различные типы запросов, сложные структуры схем, и разные базы данных. Результаты показали, что `SQL-Exchange` эффективно преобразует запросы, сохраняя их структуру и семантику. Он также показал, что использование трансформированных запросов в качестве вводных примеров для "in-context learning" улучшает производительность текст-to-SQL систем по сравнению с использованием запросов из исходной схемы.
#### Значимость
`SQL-Exchange` может применяться в различных областях, где необходимо переводить SQL-запросы между разными базами данных, таких как бизнес-аналитика, мобильные приложения, и системы управления базами данных. Он обеспечивает более точное и надежное преобразование запросов, снижая риск ошибок и улучшая пользовательское взаимодействие с системами текст-to-SQL. Этот подход также может ускорить развитие технологий, связанных с адаптацией баз данных и систем текстового поиска.
#### Выводы
`SQL-Exchange` достигает успешного преобразования SQL-запросов между разными схемами, сохраняя их семантику и структуру. Он показал свою эффективность в различных контекстах и может
Annotation:
We introduce SQL-Exchange, a framework for mapping SQL queries across
different database schemas by preserving the source query structure while
adapting domain-specific elements to align with the target schema. We
investigate the conditions under which such mappings are feasible and
beneficial, and examine their impact on enhancing the in-context learning
performance of text-to-SQL systems as a downstream task. Our comprehensive
evaluation across multiple model families and benchmark datasets--a...
Авторы:
Hyo Jin Do, Werner Geyer
#### Контекст
В сети AI-систем, в частности large language models (LLM), существует значительная проблема: они часто генерируют выходные данные, которые выглядят правдоподобными, но являются фактически неверными. Это может привести к ошибочным решениям пользователей, которые доверяют AI без контроля. Чтобы уменьшить риск таких ошибок, исследователи исследуют способы предоставления пользователям оценок фактической точности AI-генерируемого контента. Однако мало известно о том, как открытие и транспарентность фактической точности влияют на доверие пользователей. В частности, неясно, является ли открытие неточного контента более убедительным, чем его скрытие, и как это сказывается на ощущении доверия и качества ответа.
#### Метод
Для изучения этого вопроса была проведена исследовательская работа с участием людей (N = 148). Исследователи сравнили воздействие пяти стратегий представления фактической точности AI-контента: 1) **объяснение потенциальной неточности** (highlights), 2) **выделение точных фрагментов** (attention), 3) **скрытие менее точного контента** (opaque), 4) **затухание неточности** (ambiguity) и 5) **базовая ситуация** (без фактических оценок). Для этих стратегий проводились эксперименты в сценариях вопроса-ответа (QA). Оценки доверия и качества ответов собирались через специальные опросы и метрики.
#### Результаты
Эксперименты показали, что стратегия **opaque** (скрытие менее точных фрагментов) и **ambiguity** (затухание неточности) привели к высокому уровню доверия пользователей. Эти стратегии не только защищали качество ответов, но и снижали степень неуверенности, сравниваясь с другими подходами. Например, пользователи чувствовали, что ответы скрытием ненадежного контента более убедительны, нежели при использовании других стратегий, которые могут сделать ответы более неясными.
#### Значимость
Эти находки имеют значительное значение для сферы AI-коммуникации. Обнаружено, что скрытие неточного контента может повысить доверие пользователей к AI, не привлекая к снижению качества ответов. Это не только улучшает потенциальное применение AI в ситуациях, где требуется доверие, но и может способствовать развитию более удобочитаемых и понятных интерфейсов.
#### Выводы
Основываясь на результатах, скрытие менее точного контента может считаться эффективным подходом для повышения доверия без ущерба качеству ответов. Дальнейшие исследования должны изучать эффективность этого подхода в различных сферах применения AI, включая ситуации, где пользователи должны принимать важные решения на основе AI-генерируемых данных. Наиболее эффективные ст
Annotation:
Large language models are known to produce outputs that are plausible but
factually incorrect. To prevent people from making erroneous decisions by
blindly trusting AI, researchers have explored various ways of communicating
factuality estimates in AI-generated outputs to end-users. However, little is
known about whether revealing content estimated to be factually incorrect
influences users' trust when compared to hiding it altogether. We tested four
different ways of disclosing an AI-generated ...
📄 Less Is More: Training-Free Sparse Attention with Global Locality for Efficient Reasoning
2025-08-13Авторы:
Lijie Yang, Zhihao Zhang, Arti Jain, Shijie Cao, Baihong Yuan, Yiwei Chen, Zhihao Jia, Ravi Netravali
####################
## Контекст
####################
Улучшение размерности и скорости вывода является ключевым заданием в машинном обучении, особенно при работе с текстовыми данными. Несмотря на улучшения, достигнутые большими моделями в области логического роста, эти модели требуют большого объема вычислительных ресурсов, особенно при оценке большого количества токенов. Это становится проблемой в случае коротких входных запросов, где вычислительные затраты на построение выходных последовательностей не пропорциональны входной информации. Более того, существующие спарсированные механизмы внимания, которые пытаются уменьшить эти затраты, часто подвержены ошибкам, которые накапливаются при длительном генерировании. Эти ошибки могут привести к ухудшению точности. Мы предлагаем LessIsMore, новый механизм спарсированного внимания, который работает без необходимости дополнительного обучения, используя глобальные взаимосвязи вместо локальных оптимизаций. Это позволяет повысить эффективность и обеспечить лучшую универсальность.
####################
## Метод
####################
Мы предлагаем LessIsMore, многоголосийский механизм спарсированного внимания, который агрегирует выбор токенов из локальных заголовков вместе с реконтекстуализацией на основе контекста. Метод работает следующим образом: выбранные токены из каждого локального заголовка объединяются и преобразуются в общую оценку всех токенов во всех заголовках. Это позволяет уменьшить количество токенов, которые необходимо обрабатывать при декодировании, при этом сохраняя точность. Механизм LessIsMore не требует дополнительного обучения и может применяться как к существующим моделям, так и к новым. Этот подход уменьшает требования к вычислительным ресурсам и повышает производительность, сохраняя высокую точность.
####################
## Результаты
####################
Мы использовали LessIsMore в различных моделях логического роста и выполнили эксперименты на различных бенчмарках. Наши результаты показывают, что LessIsMore повышает эффективность, снижая число обрабатываемых токенов на $2\times$ по сравнению с существующими методами, при этом сохраняя высокую точность. Он позволяет снизить затраты на вычисления на $1.1\times$ в сравнении с полным вниманием и $1.13\times$ по сравнению с другими спарсированными методами. Это демонстрирует, что LessIsMore может эффективно уменьшить затраты на вычисления при оценке данных, не теряя точности.
####################
## Значимость
####################
LessIsMore может быть применен в различных областях, где требуется высокая производительность и эффективность при обработке текстовых данных. Это может быть полезно в ситуациях, когда требуется высокая скорость вывода, таких как в реальном времени генер
Annotation:
Large reasoning models achieve strong performance through test-time scaling
but incur substantial computational overhead, particularly from excessive token
generation when processing short input prompts. While sparse attention
mechanisms can reduce latency and memory usage, existing approaches suffer from
significant accuracy degradation due to accumulated errors during
long-generation reasoning. These methods generally require either high token
retention rates or expensive retraining. We introd...
Авторы:
Yang Cao, Yubin Chen, Zhao Song, Jiahao Zhang
## Контекст
Generative моделирование является ключевым направлением в искусственном интеллекте, нацеленным на создание реалистичных генерируемых данных. Одним из актуальных подходов является Flow Matching, который используется для генерирования высококачественных данных. Одна из проблем этого подхода заключается в том, что он часто требует многошаговых процедур для точного сэмплинга, что растягивает время и сложность вычислений. Другая проблема заключается в ограниченной выразительности существующих моделей. Эти проблемы мотивируют развитие моделей, которые обладают более богатыми динамическими свойствами и эффективным сэмплингом.
## Метод
В данной работе предлагается расширение MeanFlow, называемое Second-Order MeanFlow. Он включает средние ускорение поля в объектив генеративной модели. Для доказательства физической и теоретической стабильности Second-Order MeanFlow используется аналогия с первоначальным MeanFlow. Для оценки выразительности применяется метод анализа сложности алгоритмов, а именно, анализ циркуляционной сложности. Чтобы обеспечить эффективность, используются аппроксимации аттенционных операций, чья точность доказана с помощью теоретических рассуждений.
## Результаты
Проведенные эксперименты показали, что Second-Order MeanFlow позволяет достичь более высокой выразительности и эффективности по сравнению с первоначальным MeanFlow. Эксперименты проводились на различных наборах данных, таких как MNIST и CIFAR-10. Результаты показали, что модель не только эффективнее в сэмплировании, но и обладает более богатыми динамическими свойствами. Это позволяет генерировать более реалистичные данные и увеличивает скорость вычислений.
## Значимость
Выделенные результаты могут быть применены в различных областях, включая генерирование текста, изображений и звука. Высокая эффективность модели позволяет использовать ее в реальном времени приложениях, таких как генерирование реалистичных изображений в мобильных приложениях. Богатые динамические свойства Second-Order MeanFlow открывают новые возможности в моделировании сложных систем, таких как климатические процессы или динамика товаров на рынке.
## Выводы
В результате проведенного исследования доказана возможность развития точных и выразительных генерирования данных с помощью Second-Order MeanFlow. Однако, необходимо продолжить развитие этого подхода для решения более широкой класса задач, включая генерирование в реальном времени и моделирование сложных систем. Будущие исследования будут направлены на улучшение точности аппроксимации аттенционных операций и расширение модели для работы с более большими и сложными наборами данных.
Annotation:
Generative modelling has seen significant advances through simulation-free
paradigms such as Flow Matching, and in particular, the MeanFlow framework,
which replaces instantaneous velocity fields with average velocities to enable
efficient single-step sampling. In this work, we introduce a theoretical study
on Second-Order MeanFlow, a novel extension that incorporates average
acceleration fields into the MeanFlow objective. We first establish the
feasibility of our approach by proving that the a...
Авторы:
Timothy Oluwapelumi Adeyemi, Nadiah Fahad AlOtaibi
#### Контекст
В последние годы сфера образовательных технологий набирает все большую популярность, особенно с точки зрения динамического прогнозирования показателей студенческой активности и их интервенции. Однако существующие решения часто ограничиваются статическими моделями прогнозирования, не учитывающими новые данные, например, после выполнения интервенции. Это значительно снижает достоверность прогнозов и их применимость в реальных учебных процессах. Необходимость в адаптивных системах, которые могут активно реагировать на изменения в поведении студентов, стала мотивацией для разработки автоматизированных инструментов с целью оптимизации учебного процесса.
#### Метод
Разработанная система Feedback-Driven Decision Support System (DSS) основывается на архитектуре closed-loop, позволяющей регулярно обновлять модели прогнозирования на основе поступающих данных об интервенциях и результатах студентов. Фундаментом системы является LightGBM-регрессор с инкрементным ретренингом, который адаптируется к новым данным. Для улучшения удобства использования интерактивная Flask-базированная веб-панель позволяет операторам вносить изменения в модель и сразу же отслеживать их влияние на прогнозы. Дополнительно, интегрирована SHAP-аналитика, обеспечивающая прозрачность и надежность модели, дающие уверенность в рекомендациях системы.
#### Результаты
Эксперименты проводились на данных, представляющих студенческие результаты до и после интервенций. Результаты показали снижение RMSE на 10.7% после регулярного обновления модели. Прогнозы для студентов, получивших интервенции, адаптивно перестраивались вверх в зависимости от улучшений в их результатах. Эти результаты подтверждают высокую точность и способность системы адаптироваться к индивидуальным изменениям в активности студентов.
#### Значимость
Система имеет широкие области применения, в том числе в образовательных учреждениях для мотивации студентов, анализа прогресса и отслеживания интервенций. Ее преимущества включают улучшение точности прогнозов, интерактивность и возможность непрерывного обновления. Потенциальное влияние заключается в том, что система может стать основой для новых подходов в образовательных анализах, обеспечивая более эффективный динамический подход к интервенциям.
#### Выводы
Разработанная система демонстрирует высокую эффективность в плане динамического моделирования и поддержки интервенций. Будущие исследования будут нацелены на расширение функциональности системы, включая добавление новых алгоритмов и повышение скорости реакции на изменения. Также планируется расширение возможносте
Annotation:
Accurate prediction of student performance is essential for enabling timely
academic interventions. However, most machine learning models used in
educational settings are static and lack the ability to adapt when new data
such as post-intervention outcomes become available. To address this
limitation, we propose a Feedback-Driven Decision Support System (DSS) with a
closed-loop architecture that enables continuous model refinement. The system
employs a LightGBM-based regressor with incremental r...
Авторы:
Falaah Arif Khan, Nivedha Sivakumar, Yinong Oliver Wang, Katherine Metcalf, Cezanne Camacho, Barry-John Theobald, Luca Zappella, Nicholas Apostoloff
## Контекст
Large language models (LLMs) — мощные языковые модели, обладающие высоким уровнем производительности и широко распространенными в сфере решения задач решения, включая сферу принятия решений в таких областях, как трудоустройство и вступительные экзамены. Однако их влияние не ограничивается положительными аспектами. Научно принято, что AI системы могут отражать и усиливать социальные биасы, что вызывает опасения в отношении потенциального вреда от использования таких систем в критически важных социальных сферах. До этого уже было проведено многочисленное исследование, показавшее, что модели LLM могут склоняться к демографическим дискриминациям в различных языковых задачах. Мы расширяем этот подход, проводя оценку биаса в терминах интерсекционального подхода, который учитывает взаимодействие различных факторов дискриминации.
## Метод
Мы разработали новый бенчмарк под названием **WinoIdentity**, который является усовершенствованием WinoBias датасета, добавив 25 новых демографических маркеров (таких как возраст, национальность, расовые признаки), которые взаимодействуют с гендером. Это способствовало созданию 245 700 запросов для оценки 50 различных шаблонов биаса. Мы сосредоточились на потенциальных характеристиках, связанных с упущениями в результатах в ситуациях подреpresentation (безделющей дискриминации). В качестве новой метрики мы предложили **Coreference Confidence Disparity**, которая измеряет разницу в уверенности модели LLM в зависимости от интерсекциональных характеристик. Мы провели эксперименты с 5 недавно опубликованными LLMs.
## Результаты
Наши эксперименты показали, что потенциально вызволяющие биасы могут достигать до 40% в зависимости от таких атрибутов, как телосложение, половая ориентация и социально-экономический статус. Мы обнаружили, что LLMs чаще были неуверенными в предположениях в anti-stereotypical ситуациях, а также уменьшалась уверенность даже в отношении гегемонических маркеров. Это указывает на то, что некоторые текущие успехи моделей LLM могут быть связаны с запоминанием, а не с логическим рассуждением. Это две независимые ошибки, связанные с значением и достоверностью, могут существенно повлиять на социальные злоупотребления.
## Значимость
Наша работа открывает путь к пониманию интерсекциональных биасов в LLMs и их последствиях в критически важных социальных сферах. Мы видим применение наших результатов в сфере трудоустройства, образования и финансовых услуг. Эти результаты могут помочь внедрить более справедливые и точные модели в реальном мире и снизить риски социального вреда.
## Выводы
Мы указали на
Annotation:
Large language models (LLMs) have achieved impressive performance, leading to
their widespread adoption as decision-support tools in resource-constrained
contexts like hiring and admissions. There is, however, scientific consensus
that AI systems can reflect and exacerbate societal biases, raising concerns
about identity-based harm when used in critical social contexts. Prior work has
laid a solid foundation for assessing bias in LLMs by evaluating demographic
disparities in different language r...
📄 Pref-GUIDE: Continual Policy Learning from Real-Time Human Feedback via Preference-Based Learning
2025-08-13Авторы:
Zhengran Ji, Boyuan Chen
## Контекст
В настоящее время тренировка агентов в среде reinforcement learning (RL) с помощью руководства человеческим опытным мнением является ключевым приложением в области робототехники, игр и даже здравоохранения. Однако, возникают проблемы при определении задач через конкретные цели в виде регулярных вознаграждений, которые трудно уточнить в некоторых ситуациях. Особенно важно научить агентов принимать решения в реальном времени, где нет доступа к большим историям траекторий для определения предпочтений человека. Предыдущие работы использовали сравнения между траекториями, но они неэффективны в ситуациях, когда требуется онлайн-адаптация. Недавние методы стремятся к собиранию реального временного скалярного руководства от пользователей для последующей обученной модели награды. Однако, скалярное руководство часто шумно и непоследовательно, что приводит к ограниченной точности и плохим результатам обучения. Мы предлагаем Pref-GUIDE, метод, который превращает скалярное руководство в понятную для машины структуру предпочтений, что приводит к лучшей модели награды и лучшему обучению политики в онлайн-режиме.
## Метод
Pref-GUIDE предлагает два основных механизма для улучшения обучения моделей наград на основе скалярного руководства. Алгоритм Pref-GUIDE Individual сравнивает поведение агента во временных окнах, чтобы исключить непоследовательности в скалярных значениях. Затем, он использует техники фильтрации, чтобы удалить шумные и непонятные отзывы. Pref-GUIDE Voting расширяет этот подход, агрегируя модели награды с нескольких пользователей, чтобы образовать квази-консенсус пользовательских предпочтений. Это позволяет повысить стабильность и общую точность вывода модели. Основной инновацией Pref-GUIDE является его способность преобразовывать реальное временное руководство в более структурированные предпочтения, что позволяет создавать рекомендации более точные и устойчивые к ошибкам.
## Результаты
Мы проверили Pref-GUIDE на трех сложных средах: графической игре, научном моделировании и динамической системе с управлением. Мы сравнили Pref-GUIDE с двумя базовыми методами, которые также используют скалярное руководство от пользователей. Наши эксперименты показали, что Pref-GUIDE превосходит эти методы в обеих средах, повышая точность модели награды и улучшая поведение агента во время работы. Особенно заметны результаты в окружении с динамической системой управления, где Pref-GUIDE Voting показал результаты, сопоставимые с моделями, обученными на основе десятков тысяч пользовательских предпочтений. Эти результаты демонстрируют, что Pref-GUIDE может эффективно использовать ре
Annotation:
Training reinforcement learning agents with human feedback is crucial when
task objectives are difficult to specify through dense reward functions. While
prior methods rely on offline trajectory comparisons to elicit human
preferences, such data is unavailable in online learning scenarios where agents
must adapt on the fly. Recent approaches address this by collecting real-time
scalar feedback to guide agent behavior and train reward models for continued
learning after human feedback becomes una...
Авторы:
Gregory Schuit, Denis Parra, Cecilia Besa
#### Контекст
Генерирующие изображения модели, такие как генерирующие адверсарные сети (GANs) и модели диффузии (DMs), показали свою эффективность в области генерирования изображений, включая медицинскую имеджинг. В частности, это относится к области радиологии, где синтетические изображения могут устранить проблему нехватки данных, особенно для редких заболеваний, которые снижают эффективность AI-based диагностики и сегментации. Однако остаются вопросы относительно качества синтетических изображений и их клинической полезности. Недостаточное генерирование может снизить универсальность моделей и их доверие. Наше исследование фокусируется на оценке эффективности GANs и DMs в синтезе X-ray изображений, особенно для таких аномалий, как Atelectasis (AT), Lung Opacity (LO), Pleural Effusion (PE), и Enlarged Cardiac Silhouette (ECS). Мы проводим читательское исследование с участием радиологов разных уровней опыта, чтобы изучить качество синтетических изображений в сравнении с реальными.
#### Метод
Мы создали бенчмарк, который включал реальные X-ray изображения из датасета MIMIC-CXR и синтетические изображения, генерируемые GANs и DMs. Эти изображения были упорядочены по четырём классам аномалий. Мы провели читательское исследование с участием трёх радиологов разных уровней опыта. Участники должны были отличить реальные от синтетических изображений и оценить согласованность визуальных признаков с фокусируемой аномалией. Мы использовали метрики, такие как точность распознавания и чувствительность, чтобы измерить качество моделей. Также, мы проанализировали визуальные критерии, которые помогали радиологам выявить синтетические изображения.
#### Результаты
Наши результаты показали, что DMs генерируют более реалистичные изображения в целом, особенно для пространственных деталей и общей имитации естественного шума. Однако GANs показали лучшую точность в определении конкретных условий, таких как отсутствие ECS. Мы также выявили визуальные признаки, помогающие радиологам отличать синтетические изображения, такие как неестественная текстура и несогласованность в локализации. Эти результаты показывают, что GANs и DMs имеют дополнительные сильные стороны и могут быть использованы вместе для повышения качества синтетических данных в AI-системах.
#### Значимость
Наше исследование выявило важное применение GANs и DMs в производстве синтетических изображений для обучения AI-систем в радиологии. Мы показали, что DMs могут использоваться для широкой генерации качественных изображений, в то время как GANs могут специализироваться в накладываемых задачах. Э
Annotation:
Generative image models have achieved remarkable progress in both natural and
medical imaging. In the medical context, these techniques offer a potential
solution to data scarcity-especially for low-prevalence anomalies that impair
the performance of AI-driven diagnostic and segmentation tools. However,
questions remain regarding the fidelity and clinical utility of synthetic
images, since poor generation quality can undermine model generalizability and
trust. In this study, we evaluate the effe...
📄 Toward AI Matching Policies in Homeless Services: A Qualitative Study with Policymakers
2025-08-13Авторы:
Caroline M. Johnston, Olga Koumoundouros, Angel Hsing-Chi Hwang, Laura Onasch-Vera, Eric Rice, Phebe Vayanos
#### Контекст
Доступ к жилью для тех, кто находится в условиях бездомности, широко признан как ключевой фактор для сокращения уровня бедности и повышения качества жизни. Однако существуют существенные проблемы, связанные с эффективностью и справедливостью системы распределения жилья, особенно в быстрорастущих городах. Использование искусственного интеллекта (AI) для оптимизации распределения ресурсов становится возможным выходом из этой ситуации. Однако остается неясным, насколько будут приняты такие технологии в ходе принятия решений в сфере бездомных услуг, а также какие будут их последствия.
#### Метод
Для исследования были проведены 13 поseм-структурированных интервью с политиками и менеджерами в сфере бездомных услуг в Лос-Анджелесе. Интервью были направлены на идентификацию точек зрения политиков по поводу возможности использования AI-систем для размещения жилья. Участники должны были оценить возможность повышения эффективности, справедливости и прозрачности такой системы, а также выразить свои сомнения и ожидания. Интервью были записаны и последующим текстовым анализом полученных данных определены главные тренды.
#### Результаты
Политики, принявшие участие в исследовании, в основном приветствовали идею использования AI-систем для оптимизации распределения жилья. Они увидели в ней потенциал для повышения эффективности и улучшения прозрачности процесса. Однако были выявлены ряд осведомленности о потенциальных недостатках, таких как предполагаемая необходимость в учете контекста и доверии к системе. Многие указали на то, что люди должны оставаться в центре процесса принятия решений. Таким образом, полученные результаты показали, что AI может иметь свои преимущества, но его применение должно быть тщательно продумано и взаимодействовать с человеческими решающими.
#### Значимость
Исследование показывает, что AI может играть важную роль в улучшении процессов распределения жилья. Его преимущества включают в себя значительную экономию ресурсов и улучшение прозрачности. Однако, чтобы получить эти преимущества, необходимо учитывать потребности разных пользователей и интегрировать AI с ручными решениями. Это исследование может помочь разработчикам и политикам создавать более эффективные и ответственные системы, которые будут учитывать не только технологические возможности, но и социальные и этические факторы.
#### Выводы
Исследование указало на возможность использования AI в сфере бездомных услуг, но также выделило необходимость в тщательной работе над проектированием и применением таких систем. Будущие исследо
Annotation:
Artificial intelligence researchers have proposed various data-driven
algorithms to improve the processes that match individuals experiencing
homelessness to scarce housing resources. It remains unclear whether and how
these algorithms are received or adopted by practitioners and what their
corresponding consequences are. Through semi-structured interviews with 13
policymakers in homeless services in Los Angeles, we investigate whether such
change-makers are open to the idea of integrating AI in...
Авторы:
Dirk HR Spennemann
## Контекст
Область исследования связана с исследованием влияния генерирующих систем на социальное восприятие профессиональных ролей. Этот вопрос приобрёл актуальность в последние годы, когда генерирующие модели искусственного интеллекта (AI) стали востребованными инструментами для генерации изображений и текстов. В статье рассматривается проблема воспроизведения стереотипов в изображениях, генерируемых моделью ChatGPT4o. Эта модель входит в крупнейшие генерирующие системы и широко используется в различных приложениях. Несмотря на высокую точность AI, она не всегда отражает реальность. Тем более, если речь идёт о профессиональных ролях, профилях которых могут быть основаны на устаревших стереотипах. Такое отношение к генерируемым изображениям может привести к устойчивости фальшивых представлений о профессии. Например, в области культурных услуг, где работники часто сталкиваются с клиентами и партнёрами, некорректное представление может привести к стереотипированному взгляду на конкретную профессию.
## Метод
Для анализа использовалась модель ChatGPT4o, генерирующая изображения на основе текстовых запросов. Автор создал 230 текстовых запросов, описывающих профессию культурных работников, и получил 230 изображений. Далее он проанализировал эти изображения на наличие стереотипов, которые могут быть связаны с профессиональными ролями культурных работников. Автор использовал визуальные анализы и статистический анализ, чтобы определить, какие стереотипы воспроизводятся в генерируемых изображениях. Он также сравнил результаты генерируемых изображений с демографическими данными о реальных культурных работниках.
## Результаты
В результате анализа выяснилось, что генерирующая модель ChatGPT4o генерирует изображения, которые в основном не отражают реальную демографию культурных работников. Например, они тенденционно представляют национальные меньшинства, такие как Африканцы и Латиноамериканцы, в значительно меньшем количестве, чем они есть в реальности. Также отчётливо выделяются определённые стереотипы, такие как юный возраст (79% изображений), стиль одежды, похожий на модные рекламы, и атрибуты, такие как борода и принадлежности, такие как клипборды или электронные таблетки. Однако изображения не отражают полноту настоящего профессионального состава: женщины во вторичных ролях вообще отсутствуют в генерируемых изображениях, хотя их процент в реальности составляет 49-72%. Это свидетельствует о существующих стереотипах и их влиянии на систему генери
Annotation:
Based on 230 visualisations, this paper examines the depiction of museum
curators by the popular generative Artificial Intelligence (AI) model,
ChatGPT4o. While the AI-generated representations do not reiterate popular
stereotypes of curators as nerdy, conservative in dress and stuck in time
rummaging through collections, they contrast sharply with real-world
demographics. AI-generated imagery extremely underrepresents women (3.5% vs 49%
to 72% in reality) and disregards ethnic communities other...
Показано 13971 -
13980
из 14827 записей