📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Hyo Jin Do, Rachel Ostrand, Werner Geyer, Keerthiram Murugesan, Dennis Wei, Justin Weisz

## Контекст Область исследования связана с технологиями глубокого обучения, в частности с широко распространенными large language models (LLMs). Несмотря на высокую эффективность LLMs в создании текстов, они часто страдают от "халлуцинаций" или "конфабуляций" — производства неточной или неверной информации. Хотя существуют методы для оценки и определения такого неточного текста, проблема заключается в том, как эффективно информировать пользователей об этом. Авторы статьи выделяют необходимость в разработке понятных интерфейсов, которые упростят пользователям валидацию точности ответов LLMs. ## Метод Исследователи провели два эксперимента с участием 208 участников, используя сценарии, в которых LLMs формировали ответы на вопросы. В экспериментах участники оценивали различные стили отображения фактичности ответов: от нетиповых отображений до цветового кодирования фраз в зависимости от их фактичности. Цель экспериментов — определить, какой подход будет наиболее эффективным для улучшения понимания и доверия к ответам LLMs. ## Результаты Полученные результаты показали, что участники предпочитали и доверяли стилю, в котором все фразы в ответе были цветом обозначены в зависимости от их фактичности. Этот подход также позволил участникам более легко проверять точность ответов по сравнению с базовым стилем, в котором не применялось никакого цветового кодирования. Наивысшие оценки получили цветовые индикаторы, которые позволяли быстро определить надежность отдельных фраз в ответе. ## Значимость Найденные результаты имеют практическое значение для разработчиков и дизайнеров интерфейсов LLMs. Они предложили конкретные рекомендации по цветовому обозначению фактичности ответов, что будет улучшать доверие пользователей и упрощать валидацию ответов. Эта работа может быть применена в различных сферах, где требуется высокая точность информации, таких как медицина, юриспруденция и образование. ## Выводы Авторы пришли к выводу, что цветовое кодирование фактичности ответов является эффективным способом улучшить понимание и доверие к LLMs. Они также направили свои исследования в будущее, подчеркнув необходимость дальнейшего исследования повышения транспарентности и эффективности интерфейсов LLMs. Эти разработки могут способствовать более уверенному использованию технологий глубокого обучения в различных сферах жизнедеятельности.
Annotation:
Large language models (LLMs) are susceptible to generating inaccurate or false information, often referred to as "hallucinations" or "confabulations." While several technical advancements have been made to detect hallucinated content by assessing the factuality of the model's responses, there is still limited research on how to effectively communicate this information to users. To address this gap, we conducted two scenario-based experiments with a total of 208 participants to systematically com...
ID: 2508.06846v1 cs.HC, cs.AI
Авторы:

Lei Zhang, Shuyao Zhou, Amna Liaqat, Tinney Mak, Brian Berengard, Emily Qian, Andrés Monroy-Hernández

#################### ## Контекст #################### В последние годы AI-enabled AR технологии набирают популярность, особенно в области образования. Однако, несмотря на их потенциал, эти технологии чаще всего используются в качестве средств потребления, а не создания. Это ограничивает возможности детей для компетентного взаимодействия с технологиями и их потенциального творческого выражения. Проблема заключается в том, что дети, как правило, используют предопределенные виртуальные среды и не могут настраивать их под свои потребности или творческие идеи. Это способствует ограниченному развитию их творческих и программирующих навыков. Было бы значительным улучшением, если бы дети могли не только потреблять AI-enabled AR технологии, но и творить, превращая себя в активных создателей. #################### ## Метод #################### Для решения этой проблемы предлагается Capybara — AR-ориентированная и AI-движок, предоставляющий детям возможность творить в виртуальной реальности. Основной функционал Capybara — это возможность создания и анимации 3D-персонажей, которые могут быть оверлеянными на физическую среду. Дети могут создавать эти персонажи и аксессуары, используя текст-в-3D-генерирующие AI-модели. Для анимации используется автоматический механизм "риггинга" и технология тела-трекинга. Кроме того, Capybara включает в себя видю-бейсные AI-модели, позволяющие детям программировать взаимодействия между виртуальными персонажами и физическими объектами. Это решение позволяет детям творить в интерактивной среде, связывающей виртуальные и физические пространства. #################### ## Результаты #################### В ходе экспериментов, проведенных с участием 20 детей из США и Аргентины, было показано, что Capybara позволяет детям творить и программировать виртуальные среды с высокой степенью выразительности. За подробностями результатов можно обратиться к оригинальной статье. #################### ## Значимость #################### Capybara может применяться в различных областях, включая образовательные программы, творческие среды, игровые приложения. Оно дает детям возможность раскрыть свой творческий потенциал, научиться программированию и пониманию технологий AI. Это способствует раннему развитию цифровых навыков, мотивирует детей к инновационным решениям и способствует их участию в создании будущих технологий. #################### ## Выводы #################### Capybara доказала свою эффективность в том, что она позволяет детям творить в сфере AI-enabled AR технологий. Это не только вдохновляет детей на творчество, но и внедряет в них базовые навыки в программировании и понимании AI-технологий. Будущие исследования б
Annotation:
Despite their potential to enhance children's learning experiences, AI-enabled AR technologies are predominantly used in ways that position children as consumers rather than creators. We introduce Capybara, an AR-based and AI-powered visual programming environment that empowers children to create, customize, and program 3D characters overlaid onto the physical world. Capybara enables children to create virtual characters and accessories using text-to-3D generative AI models, and to animate these...
ID: 2508.08467v1 cs.HC, cs.AI, cs.GR, cs.PL
Авторы:

Jon E. Froehlich, Alexander Fiannaca, Nimer Jaber, Victor Tsara, Shaun Kane

## Контекст Проблема доступности виртуальных стритвью-инструментов для слепых пользователей остается актуальной. Несмотря на распространенность сервисов типа Google Street View (GSV) и Meta Mapillary, они остаются недоступными для незрячих пользователей из-за отсутствия возможности визуального восприятия этих средств. Это затрудняет выполнение таких задач, как поиск места и рассмотрение виртуальной турологии. Было проведено несколько исследований по созданию доступных средств виртуального зрения, но они не решали все проблемы, включая недостаток контекстной информации и работы с голосовыми командами. ## Метод StreetViewAI использует контекстно-активный мультимодальный подход, который объединяет три ключевых компонента: 1) контекстно-активный поиск объектов интереса (POI), 2) поддержка голосовых команд, 3) поддержку визуальной информации. Метод позволяет использовать голосовые команды для поиска и управления виртуальным зрением, чтобы предоставить пользователям независимость в навигации. Для обеспечения поддержки голосовых команд используется встроенный текстовый редактор и голосовая синтезированная речь. ## Результаты На основе данных Google Street View и Meta Mapillary, StreetViewAI проводил эксперименты с 11 слепыми пользователями. Он продемонстрировал способность помочь пользователям в улучшении доступности и удобства виртуального зрения. Эксперименты показали, что пользователи могут эффективно использовать StreetViewAI для рассмотрения мест и планирования маршрутов. Эти результаты подтверждают ценность доступного виртуального стритвью для слепых пользователей. ## Значимость StreetViewAI может использоваться в различных областях: 1) помощь в планировании маршрутов для слепых пользователей, 2) интерактивное виртуальное зрение для доступа к различным местам, 3) повышение уровня независимости в виртуальном окружении. Это может сделать эти средства более доступными для пользователей с ограниченными возможностями. ## Выводы StreetViewAI является первым доступным виртуальным стритвью-инструментом, который использует контекстно-активный мультимодальный подход. Результаты экспериментов подтверждают ценность этого инструмента для повышения доступности. Будущие исследования будут сфокусированы на исследовании более широких потребностей слепых пользователей, включая поддержку более сложных задач виртуального зрения.
Annotation:
Interactive streetscape mapping tools such as Google Street View (GSV) and Meta Mapillary enable users to virtually navigate and experience real-world environments via immersive 360{\deg} imagery but remain fundamentally inaccessible to blind users. We introduce StreetViewAI, the first-ever accessible street view tool, which combines context-aware, multimodal AI, accessible navigation controls, and conversational speech. With StreetViewAI, blind users can virtually examine destinations, engage i...
ID: 2508.08524v1 cs.HC, cs.AI, H.5; I.2
Авторы:

Anaëlle Beignon, Thomas Thibault, Nolwenn Maudet

## Контекст Генерирующая ИИ технология находится в стадии массового развертывания в цифровых сервисах, что приводит к значительным экологическим последствиям. Авторы статьи поднимают вопрос о том, как технологические компании изменяют существующие пользовательские интерфейсы, чтобы принудительно заставлять пользователей пользоваться ИИ, даже когда это необязательно. Они исследуют, каким образом эти стратегии соответствуют установленным категориям дезинформации и деконструируют, как эти паттерны используются в обеих персональных и профессиональных сферах. Мотивация заключается в понимании, как эти технологии влияют на поведение пользователей и как это может быть регулировано, чтобы уменьшить негативное воздействие на окружающую среду. ## Метод Авторы проводят анализ существующих пользовательских интерфейсов, применяющих генерирующую ИИ. Они проводят теоретическую интерпретацию существующих категорий дезинформации, адаптируя их для анализа ИИ. Для этого они сравнивают паттерны стратегий, используемых для принудительного внедрения ИИ в интерфейсы, с уже существующими в цифровой отрасли. Также, они используют кейсы из области бизнеса и учебных интерфейсов, чтобы демонстрировать, как эти дезинформационные паттерны применяются к пользователям в различных сферах. ## Результаты Авторы выявляют две главные стратегии, применяемые для принудительного внедрения ИИ: замена существующих функций не-ИИ-функциями ИИ и создание позитивных сюжетов о ИИ, которые делают его более привлекательным и менее отказником. Они приводят примеры, включая случаи из области бизнеса, где ИИ внедряется в интерфейсы, и школьные системы, где пользователи принуждаются к применению ИИ для выполнения задач. Эти совпадения позволяют показать, как эти паттерны влияют на поведение пользователей и почему они трудно противостоять. ## Значимость Особенно важно это исследование в свете роста применения ИИ в различных областях, в том числе в образовании, бизнесе и в сфере повседневного использования. Изучение этих дезинформационных паттернов позволяет понять, как ИИ повлияло на поведение пользователей и как можно регулировать способы внедрения AI, чтобы снизить его экологическое воздействие. Это также открывает пути для разработки более прозрачных и этичных пользовательских интерфейсов, которые могут помочь сохранить устойчивость и экологическое сознание. ## Выводы Авторы заключают, что необходимо развитие регулирующих мер для уменьшения влияния дезинформационных паттернов, имплементируемых в И
Annotation:
Generative AI is being massively deployed in digital services, at a scale that will result in significant environmental harm. We document how tech companies are transforming established user interfaces to impose AI use and show how and to what extent these strategies fit within established deceptive pattern categories. We identify two main design strategies that are implemented to impose AI use in both personal and professional contexts: imposing AI features in interfaces at the expense of exist...
ID: 2508.08672v1 cs.HC, cs.AI
Авторы:

Hyo Jin Do, Werner Geyer

#### Контекст В сети AI-систем, в частности large language models (LLM), существует значительная проблема: они часто генерируют выходные данные, которые выглядят правдоподобными, но являются фактически неверными. Это может привести к ошибочным решениям пользователей, которые доверяют AI без контроля. Чтобы уменьшить риск таких ошибок, исследователи исследуют способы предоставления пользователям оценок фактической точности AI-генерируемого контента. Однако мало известно о том, как открытие и транспарентность фактической точности влияют на доверие пользователей. В частности, неясно, является ли открытие неточного контента более убедительным, чем его скрытие, и как это сказывается на ощущении доверия и качества ответа. #### Метод Для изучения этого вопроса была проведена исследовательская работа с участием людей (N = 148). Исследователи сравнили воздействие пяти стратегий представления фактической точности AI-контента: 1) **объяснение потенциальной неточности** (highlights), 2) **выделение точных фрагментов** (attention), 3) **скрытие менее точного контента** (opaque), 4) **затухание неточности** (ambiguity) и 5) **базовая ситуация** (без фактических оценок). Для этих стратегий проводились эксперименты в сценариях вопроса-ответа (QA). Оценки доверия и качества ответов собирались через специальные опросы и метрики. #### Результаты Эксперименты показали, что стратегия **opaque** (скрытие менее точных фрагментов) и **ambiguity** (затухание неточности) привели к высокому уровню доверия пользователей. Эти стратегии не только защищали качество ответов, но и снижали степень неуверенности, сравниваясь с другими подходами. Например, пользователи чувствовали, что ответы скрытием ненадежного контента более убедительны, нежели при использовании других стратегий, которые могут сделать ответы более неясными. #### Значимость Эти находки имеют значительное значение для сферы AI-коммуникации. Обнаружено, что скрытие неточного контента может повысить доверие пользователей к AI, не привлекая к снижению качества ответов. Это не только улучшает потенциальное применение AI в ситуациях, где требуется доверие, но и может способствовать развитию более удобочитаемых и понятных интерфейсов. #### Выводы Основываясь на результатах, скрытие менее точного контента может считаться эффективным подходом для повышения доверия без ущерба качеству ответов. Дальнейшие исследования должны изучать эффективность этого подхода в различных сферах применения AI, включая ситуации, где пользователи должны принимать важные решения на основе AI-генерируемых данных. Наиболее эффективные ст
Annotation:
Large language models are known to produce outputs that are plausible but factually incorrect. To prevent people from making erroneous decisions by blindly trusting AI, researchers have explored various ways of communicating factuality estimates in AI-generated outputs to end-users. However, little is known about whether revealing content estimated to be factually incorrect influences users' trust when compared to hiding it altogether. We tested four different ways of disclosing an AI-generated ...
ID: 2508.07095v1 cs.HC, cs.AI
Авторы:

Caroline M. Johnston, Olga Koumoundouros, Angel Hsing-Chi Hwang, Laura Onasch-Vera, Eric Rice, Phebe Vayanos

#### Контекст Доступ к жилью для тех, кто находится в условиях бездомности, широко признан как ключевой фактор для сокращения уровня бедности и повышения качества жизни. Однако существуют существенные проблемы, связанные с эффективностью и справедливостью системы распределения жилья, особенно в быстрорастущих городах. Использование искусственного интеллекта (AI) для оптимизации распределения ресурсов становится возможным выходом из этой ситуации. Однако остается неясным, насколько будут приняты такие технологии в ходе принятия решений в сфере бездомных услуг, а также какие будут их последствия. #### Метод Для исследования были проведены 13 поseм-структурированных интервью с политиками и менеджерами в сфере бездомных услуг в Лос-Анджелесе. Интервью были направлены на идентификацию точек зрения политиков по поводу возможности использования AI-систем для размещения жилья. Участники должны были оценить возможность повышения эффективности, справедливости и прозрачности такой системы, а также выразить свои сомнения и ожидания. Интервью были записаны и последующим текстовым анализом полученных данных определены главные тренды. #### Результаты Политики, принявшие участие в исследовании, в основном приветствовали идею использования AI-систем для оптимизации распределения жилья. Они увидели в ней потенциал для повышения эффективности и улучшения прозрачности процесса. Однако были выявлены ряд осведомленности о потенциальных недостатках, таких как предполагаемая необходимость в учете контекста и доверии к системе. Многие указали на то, что люди должны оставаться в центре процесса принятия решений. Таким образом, полученные результаты показали, что AI может иметь свои преимущества, но его применение должно быть тщательно продумано и взаимодействовать с человеческими решающими. #### Значимость Исследование показывает, что AI может играть важную роль в улучшении процессов распределения жилья. Его преимущества включают в себя значительную экономию ресурсов и улучшение прозрачности. Однако, чтобы получить эти преимущества, необходимо учитывать потребности разных пользователей и интегрировать AI с ручными решениями. Это исследование может помочь разработчикам и политикам создавать более эффективные и ответственные системы, которые будут учитывать не только технологические возможности, но и социальные и этические факторы. #### Выводы Исследование указало на возможность использования AI в сфере бездомных услуг, но также выделило необходимость в тщательной работе над проектированием и применением таких систем. Будущие исследо
Annotation:
Artificial intelligence researchers have proposed various data-driven algorithms to improve the processes that match individuals experiencing homelessness to scarce housing resources. It remains unclear whether and how these algorithms are received or adopted by practitioners and what their corresponding consequences are. Through semi-structured interviews with 13 policymakers in homeless services in Los Angeles, we investigate whether such change-makers are open to the idea of integrating AI in...
ID: 2508.07129v1 cs.HC, cs.AI
Авторы:

Ahmed M. Abuzuraiq, Philippe Pasquier

## Контекст Область исследования Explainable AI (XAI) в креативных контекстах фокусируется на создании моделей, которые не только являются черными ящиками, но также интерактивными инструментами, позволяющими участию в процессе творчества. Известно, что существующие крупные текстово-картинные модели, такие как текст-к-изображению диффузионные модели, часто трудно понять и корректировать из-за их сложности и автоматизма. Это ограничивает возможности художников для изменения и управления процессом генерирования изображений. Однако именно эта возможность модификации является ключевой для поддержки творческой практики. В нашем исследовании мы рассматриваем возможности, которые могут быть сделаны доступными через транспарентность моделей и их модификацию, чтобы позволить художникам взаимодействовать с моделью на более глубоком уровне. Наша мотивация заключается в том, чтобы создать подход, который бы стал более творческим, гибким и доступным творческим профессионалам. ## Метод Мы предлагаем "craft-based approach to explainability", который вдохновлен методом "reflection-in-action" Р. Шона. Этот подход предполагает не только разобрать модель, но и взаимодействовать с ее внутренними компонентами в течение долгого периода времени, изменяя их и изучая результаты. Мы реализовали это в виде плагина для системы ComfyUI, которая представляет собой node-based interface, позволяющий манипулировать различными частями генерирующей модели. Мы использовали различные данные, включая обучающие данные модели, для исследования того, как модификации различных узлов влияют на генерируемые изображения. Данный подход дает художникам возможность "изменять" модель в реальном времени, чтобы более ясно понять, как генерируются результаты. ## Результаты Мы провели эксперименты, в которых художники взаимодействовали с моделью, изменяя разные узлы и изучая их влияние на генерируемые изображения. Наши результаты показали, что художники стали более контролируемыми в процессе генерирования, и они могли быстрее узнавать, как различные части модели влияют на итоговый результат. Мы также обнаружили, что модификация узлов модели может привести к изменению стиля, темы и даже того, что генерируется вообще, что дает художникам большую гибкость в своей работе. ## Значимость Мы убедились, что предлагаемый подход может быть использован в творческих процессах, таких как графическое дизайн, 3D-моделирование, и даже видеосъемка. Мы видим, что такой подход может сделать модели более доступными для художников, улучшить их контроль над процессом генерирования и возможность для творческого эксперимен
Annotation:
Explainable AI (XAI) in creative contexts can go beyond transparency to support artistic engagement, modifiability, and sustained practice. While curated datasets and training human-scale models can offer artists greater agency and control, large-scale generative models like text-to-image diffusion systems often obscure these possibilities. We suggest that even large models can be treated as creative materials if their internal structure is exposed and manipulable. We propose a craft-based appro...
ID: 2508.07183v1 cs.HC, cs.AI, cs.LG, cs.MM, I.2; J.5
Авторы:

Bujar Raufi

## Контекст В последние годы становится все яснее, что электроэнцефалограмма (EEG) представляет собой мощный инструмент для изучения динамики мозговой деятельности. Однако, несмотря на свои возможности, использование EEG в области обучения машин для оценки уровня нагрузки на мозг (cognitive load state) сталкивается с рядовыми проблемами. Одна из основных проблем заключается в том, что существующие модели часто не могут точно отличить между такими сигналами, как "Rest" (отдых) и "Load" (нагрузка). Это ограничивает потенциальные применения технологий в области здравоохранения, робототехники и интеллектуальных систем. Для улучшения точности оценки нагрузки на мозг определенные исследователи принимают во внимание взаимосвязь между EEG-сигналами и микростатусами мозга (microstates). Эти микростаты — это короткие, стабильные состояния мозговой активности, которые могут сигнализируть о разных уровнях когнитивных процессов. Изучение этой связи может помочь в создании более точных моделей для оценки уровня нагрузки на мозг. Несмотря на это, существующие подходы недостаточно эффективны или недостаточно гибки для решения этой проблемы. В данном исследовании предлагается использовать микростатусы EEG в качестве источника данных для тонкой настройки (fine-tuning) Больших Моделей Языка (LLMs), чтобы улучшить их возможности в дифференциации уровней когнитивной нагрузки. Этот подход имеет значительный потенциал для развития области классификации когнитивных состояний и интеллектуальных технологий в целом. ## Метод Для достижения поставленных целей была разработана систематическая методология, состоящая из четырех запланированных этапов. **Первый шаг** — сбор и предварительная обработка данных. Для экспериментов была использована подготовленная выборка EEG, которая уже была связана с определенными уровнями когнитивной нагрузки ("Rest" и "Load"). Эта выборка была пройдена тщательной обработкой для удаления шума и исключения неточных сигналов. **Второй шаг** — сегментация EEG-сигналов и восстановление микростатусов (EEG backfitting). Микростаты были определены и использованы для создания конкретных фичей, которые могут быть использованы во время процесса обучения модели. **Третий шаг** — выделение признаков и оптимизация предложений (prompt engineering). Извлеченные микростатусы были задействованы при формировании предложений, которые были представлены модели для обучения. Эти предложения были специально сконструированы для того, чтобы обеспечить наиболее точную классификацию уровней нагрузки. **Четвертый шаг** — выбор и тонкая настройка модели. Была проведена серия экспериментов с различными моделями Больши
Annotation:
This study explores the intersection of electroencephalography (EEG) microstates and Large Language Models (LLMs) to enhance the assessment of cognitive load states. By utilizing EEG microstate features, the research aims to fine-tune LLMs for improved predictions of distinct cognitive states, specifically 'Rest' and 'Load'. The experimental design is delineated in four comprehensive stages: dataset collection and preprocessing, microstate segmentation and EEG backfitting, feature extraction pai...
ID: 2508.07283v1 cs.HC, cs.AI, eess.SP, q-bio.NC, 97R40, I.2
Авторы:

Gustavo Moreira, Leonardo Ferreira, Carolina Veiga, Maryam Hosseini, Fabio Miranda

## Контекст Область визуальных аналитических систем для городских приложений становится все более важной в свете роста доступности данных о городах и усложнения проблем, связанных с управлением городами. Тем не менее, анализ таких данных чрезвычайно сложен и итеративен, требующий широких знаний в различных областях. Проблема заключается в том, что руководство такими системами сопряжено с высокой барьерной сложностью для пользователей, не имеющих навыков в области управления данными, машинного обучения и визуализации. Выгоды, принятые широко, в области обучаемых языковых моделей могут помочь уменьшить эти барьеры, предоставив пользователям возможность выражать свои запросы в естественном языке вместо того, чтобы определять конкретные вычислительные операции. Однако универсальный шаблон, поддерживающий такие запросы, требует определенного механизма, чтобы защититься от несоответствий между пользовательским запросом, выполнением системы и результатом анализа. Эти проблемы становятся особенно заметными при работе с городскими приложениями, где требуется взаимодействие между разными сферами и экспертами. Мы предлагаем Urbanite — фреймворк для взаимодействия между человеком и искусственным интеллектом, построенный на модели данных, который позволяет пользователям управлять городскими анализами на различных уровнях, чтобы обеспечить лучшую взаимосвязь и понимание результатов. ## Метод Urbanite основывается на модели данных "dataflow" (поток данных), которая позволяет пользователям управлять анализом на разных уровнях — от высокого уровня задач до низкого уровня параметров. Устройство фреймворка включает в себя несколько ключевых компонентов: 1. **Multi-scope intent specification** (Управление спецификацией на разных уровнях): пользователи могут задавать свои запросы в естественном языке или через интерактивные визуальные элементы, чтобы уточнять свои потребности в анализе. 2. **Multi-resolution definition** (Настройка по параметрам): пользователи могут определить различные резолюции в работе с данными, шаблонами, вычислениями и взаимодействиями. 3. **Explainability and provenance** (Объяснение и трассировка): Urbanite позволяет пользователям понимать, как система приходит к выводам, предоставляя подробные объяснения и протокол происходящих операций. 4. **Task flow integration** (Интеграция рабочего процесса): система объединяет различные шаблоны и данные в единое целое, позволяя пользователям легко переключаться между разными аналитическими задачами. ## Результаты Мы проверили эффективность Urbanite в нескольких сценариях, в которых участвовали эксперты по городам. В этих сценариях были использованы различные данные, такие как кар
Annotation:
With the growing availability of urban data and the increasing complexity of societal challenges, visual analytics has become essential for deriving insights into pressing real-world problems. However, analyzing such data is inherently complex and iterative, requiring expertise across multiple domains. The need to manage diverse datasets, distill intricate workflows, and integrate various analytical methods presents a high barrier to entry, especially for researchers and urban experts who lack p...
ID: 2508.07390v1 cs.HC, cs.AI
Авторы:

Leonardo Ferreira, Gustavo Moreira, Fabio Miranda

## Контекст Создание и развитие визуальных аналитических (VA) систем является сложной и итеративной задачей, требующей идеального синтеза обработки данных, аналитических способностей и визуализационных техник. Хотя ранее уже исследовались социальные и коллаборативные аспекты разработки VA-систем, практические вызовы на этапе их разработки остаются недостаточно изученными. Тем не менее, количество VA-систем возрастает, но остается ограниченным число структурированных знаний, которые могли бы подкрепить их разработку и модернизацию. Для примирения этой проблемы предлагается VA-Blueprint — методология и база знаний, которая систематически обзорит и классифицирует основные блоки VA-систем, особо значимой областью из-за сложности данных и уникальных задач. Эта подход был применен к первоначальному набору 20 систем, чтобы сформировать инициальную базу знаний и создать "синтаксис" для разработки VA-систем. Для масштабирования этого подхода, был использован глубокое обучение для автоматизации извлечения компонентов из дополнительных 81 статей (в итоге получился корпус из 101 статей), чтобы оценить эффективность метода в построении базы знаний. В итоге, этот подход позволяет лучше понять структуру VA-систем и создать базу для более структурированной, повторяемой и эффективной разработки. ## Метод Методология VA-Blueprint основывается на следующих шагах: 1. **Изучение предметной области**: Анализ и отбор систем в области визуальных анализов, особо значимых для экспертов и практиков. 2. **Классификация компонентов**: Разработка многоуровневой системы классификации, позволяющей разделить системы на базовые элементы (например, источники данных, аналитические модели, визуальные представления). 3. **Использование машинного обучения**: Использование глубокого обучения для автоматизации процесса извлечения компонентов из документов, что позволяет масштабировать базу знаний. 4. **Оценка эффективности**: Использование экспертных интервью и метрик аннотации для проверки качества работы алгоритмов. Таким образом, VA-Blueprint предлагает структурированный подход к построению визуальных аналитических систем, который может быть использован для различных сфер применения. ## Результаты Применение VA-Blueprint к первоначальному набору 20 систем позволило выделить и структурировать основные компоненты VA-систем в многоуровневую систему. Эти компоненты были потом автоматически извлечены из дополнительных 81 статей, чтобы расширить базу знаний до 101 систем. Экспертные интервью показали, что методология эффективно работает для категоризации систем и позволяет выявить потенциальные улучш
Annotation:
Designing and building visual analytics (VA) systems is a complex, iterative process that requires the seamless integration of data processing, analytics capabilities, and visualization techniques. While prior research has extensively examined the social and collaborative aspects of VA system authoring, the practical challenges of developing these systems remain underexplored. As a result, despite the growing number of VA systems, there are only a few structured knowledge bases to guide their de...
ID: 2508.07497v1 cs.HC, cs.AI
Показано 201 - 210 из 239 записей