📚 Саммари научных статей из arXiv

Найдено 14827 результатов по запросу 'cs.AI' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 35039 Добавлено сегодня: 432

Последнее обновление: сегодня

📄 Grounding Natural Language for Multi-agent Decision-Making with Multi-agentic LLMs

2025-08-13

Авторы:

Dom Huh, Prasant Mohapatra

## Контекст Язык является основным средством сотрудничества и решения задач, встречающихся как в повседневных интеракциях, так и в сложных задачах решения проблем. Однако в многоагентных системах, где несколько субъектов должны совместно принимать решения, общаться и стратегизировать, установление четкого и эффективного общения является ключевым фактором успеха. Недостаточное понимание или несовпадение языковых моделей между агентами может привести к затруднениям в сотрудничестве и принятии решений. Данная работа рассматривает область многоагентного решения задач с использованием многоязыковых глубинных сетей (LLMs), сфокусировавшись на исследовании методов гарантированного языкового синхронизации и оптимальных стратегий решения для улучшения командных решений. ## Метод Систематический подход к разработке многоагентных LLM включает в себя несколько перспективных технических решений. Алгоритмы расширенной формулировки запросов (prompt engineering) используются для точного выражения потребностей и стратегий каждого агента. Многомодальная обработка данных позволяет агентам обрабатывать текстовую информацию, изображения и другие формы мультимедиа в едином контексте. Архитектура памяти была разработана для эффективной хранения и доступа к предыдущим решениям и сообщениям. Финейзированные методы тренировки (fine-tuning) использовались для настройки модели на совместное решение задач, учитывая социальные дилеммы и теорию игр. Эти компоненты объединены в программное обеспечение, которое обеспечивает гармоничное сотрудничество между агентами. ## Результаты В экспериментах были рассмотрены классические игровые ситуации, включающие социальные дилеммы, такие как дилемма уточек и игру в кооперацию. Данные для экспериментов были подготовлены с применением многоагентных сценариев, где каждый агент отвечал за свой набор задач и стратегий. Результаты показали, что использование развитых техник LLM приводит к значительному повышению точности и эффективности решений. Абляционные исследования подтвердили значимость каждого компонента системы, в том числе продвинутой формулировки запросов, многомодального обработки данных и многоагентной настройки. ## Значимость Предложенная модель может быть применена в различных сферах, включая управление роботами, системы управления транспортом, интеллектуальные системы поддержки принятия решений и игровые системы. Основные преимущества заключаются в улучшении качества стратегического решения, эффективном взаимодействии между агентами и увеличении общей эффективности системы. П

Annotation:

Language is a ubiquitous tool that is foundational to reasoning and collaboration, ranging from everyday interactions to sophisticated problem-solving tasks. The establishment of a common language can serve as a powerful asset in ensuring clear communication and understanding amongst agents, facilitating desired coordination and strategies. In this work, we extend the capabilities of large language models (LLMs) by integrating them with advancements in multi-agent decision-making algorithms. We ...

ID: 2508.07466v1 cs.AI

arXiv PDF

📄 CP-Agent: Agentic Constraint Programming

2025-08-13

Авторы:

Stefan Szeider

## Контекст Constraint Programming (CP) является мощным подходом к решению разнообразных задач, особенно тех, которые могут быть представлены в виде ограничений. Однако главной проблемой этого подхода является трудность перевода проблем, описанных на человеческом языке, в обобщенные модели ограничений. Эта задача требует глубоких знаний в области задачи и навыков моделирования в CP. На сегодняшний день существуют стандартные рабочие процессы для автоматизации этой задачи, однако они часто ограничиваются фиксированными пайплайнами и не могут успешно решить многие реальные задачи. Наша мотивация заключается в разработке нового подхода, который бы старался решить проблему с использованием гибкого, agent-based подхода без использования фиксированного pipeline. ## Метод Мы предлагаем **CP-Agent**, который основывается на принципе **ReAct (Reason and Act)**. Этот pure agent-based подход не требует фиксированной модели для решения задач. Основным инструментом является общего назначения Python-based кодинговый agent, работающий в сочетании с **IPython kernel**, что обеспечивает stateful code execution и iterative development. Агент не встраивает никакого constraint programming logic в свою структуру. Вместо этого он получает достаточное количество domain-specific knowledge через специально сконструированное project prompt. Этот prompt включает в себя все необходимые модели, формат и ограничения, которые требуются для решения задачи. Агент также имеет доступ к файловой системе, а также способен выполнять код, тестировать гипотезы и верифицировать решения. Такой подход позволяет ему быть гибким и адаптироваться к различным задачам без нужды в предварительном определении логики. ## Результаты Мы проверили наше решение на **CP-Bench**, который содержит 101 задач constraint programming. CP-Agent успешно решил все эти задачи, показывая высокую гибкость и эффективность. Мы также провели анализ качества решений и заметили, что агент не только смог решить задачи, но и адаптировался к различным форматам и ограничениям. Это доказывает, что данный подход эффективен и может быть применен в различных областях, где требуется моделирование ограничений. ## Значимость Предлагаемый подход имеет большое количество областей применения, включая сферы, где требуется автоматизация моделирования ограничений, такие как логистика, распределение ресурсов, проектирование и даже в области AI-based decision-making. В отличие от других методов, CP-Agent предлагает более гибкий и адаптивный подход, который не требует предварительного определения моделей или рабочих процессов. Это делает его применимым в ситуациях, где задачи могут быть разнообразными и нестандартными. ## Выводы Мы доказали, что constraint modeling может быть эффективно решено с помощью agentic подходов, которые не требуют фиксированных моде

Annotation:

Translating natural language problem descriptions into formal constraint models remains a fundamental challenge in constraint programming, requiring deep expertise in both the problem domain and modeling frameworks. Previous approaches to automating this translation have employed fixed workflows with predetermined modeling steps, failing on a significant number of benchmark problems. We present a new approach using a pure agentic strategy without any fixed pipeline. We developed a general-purpos...

ID: 2508.07468v1 cs.AI, cs.CL, cs.LG, cs.SE

arXiv PDF

📄 ALOPE: Adaptive Layer Optimization for Translation Quality Estimation using Large Language Models

2025-08-13

Авторы:

Archchana Sindhujan, Shenbin Qian, Chan Chi Chun Matthew, Constantin Orasan, Diptesh Kanojia

################################# ## Контекст ################################# Область исследования — Quality Estimation (QE) для машинного перевода (MT), которая оценивает качество перевода без использования дополнительных трансляционных меток. Это задача кросс-языковая и относительно сложная для существующих моделей, особенно в случае низкоресурсных языков. Особенности QE заключаются в том, что необходимо понять, насколько хорошо генерируется перевод, не имея полных справочных трансляций. Повышенные трудности возникают при использовании моделей, которые не были предварительно обучены для регрессионных задач, а для подготовки были использованы модели с целью генерировать текст (каузиальная модельность). Большие языковые модели (LLMs), несмотря на выдающееся качество во многих задачах натурального обработки языка, в случае QE сталкиваются с проблемами, такими как несоответствие между предварительной подготовкой и регрессионными задачами. Таким образом, целью исследования является разработка адаптивной структуры, которая бы способствовала повышению качества шаблонов перевода, оптимизировав слои трансформеров на основе регрессионных задач. ################################# ## Метод ################################# Разработанная модель, ALOPE (Adaptive Layer Optimization for Translation Quality Estimation), включает в себя несколько инновационных подходов: 1. **Low-Rank Adapters (LoRA)** — это универсальные адаптации, размещенные в каждом слое трансформеров, которые позволяют уменьшить количество параметров, не ухудшая качество регрессионного предсказания. 2. **Dynamic Weighing** — стратегия, которая позволяет адаптировать веса представлений из разных слоев, оптимизируя их в соответствии с задачей QE. 3. **Multi-Head Regression** — это стратегия, в которой каждая регрессионная голова предсказывает качество перевода, а полученные результаты агрегируются в единый результат. 4. **Layer-Wise Adaptation** — механизм, который позволяет использовать только выбранные слои трансформеров для QE, адаптируя их к регрессионным задачам. Таким образом, ALOPE позволяет оптимизировать слои трансформеров для кросс-языковой регрессии, увеличивая точность и скорость обучения. ################################# ## Результаты ################################# Эксперименты проводились на различных датасетах, включающих низкоресурсные языки (например, африканский, вьетнамский) и языки с большим количеством данных (например, английский, немецкий). Для тренировки использовались модели LLMs, в том числе готовые модели Transformer с разными предобученными слоями. В результате: - Модель ALOPE показала значительное повышение точности QE по сравнению с существующими LLM-based QE моделями. - Особенно выдающиеся результаты были получены при использовании низкоресурсных языков, где дру

Annotation:

Large Language Models (LLMs) have shown remarkable performance across a wide range of natural language processing tasks. Quality Estimation (QE) for Machine Translation (MT), which assesses the quality of a source-target pair without relying on reference translations, remains a challenging cross-lingual task for LLMs. The challenges stem from the inherent limitations of existing LLM-based QE systems, which are pre-trained for causal language modelling rather than regression-specific tasks, furth...

ID: 2508.07484v1 cs.CL, cs.AI

arXiv PDF

📄 Democratizing Diplomacy: A Harness for Evaluating Any Large Language Model on Full-Press Diplomacy

2025-08-13

Авторы:

Alexander Duffy, Samuel J Paech, Ishana Shastri, Elizabeth Karpinski, Baptiste Alloui-Cros, Tyler Marques, Matthew Lyle Olson

#### Контекст Дипломатия — сложная и информационно-объемная игра, требующая стратегического мышления, взаимодействия и тонкого понимания социальных отношений. Участие в этой игре требует высокого уровня мотивации и компетентности от игроков. Существующие методы учебных и тестовых задач для оценки моделей языкового понимания не позволяют оценить их возможности в такой сложной области. Это приводит к ограниченности в широком применении моделей языкового понимания в задачах, требующих стратегического мышления. Наша мотивация заключается в том, чтобы создать метод, позволяющий оценивать модели языкового понимания на полноценных задачах дипломатии, не требуя дополнительной обучения или предварительной подготовки. #### Метод Мы предлагаем методологию, призванную оценивать модели языкового понимания на полноценной задаче дипломатии без необходимости дополнительной подготовки. Мы используем данные для итеративной оптимизации игрового пространства, чтобы улучшить комплексность и точность игрового процесса. Инновационной частью нашего подхода является использование текстовой игровой системы, которая позволяет моделям языкового понимания работать в реальном времени, упрощая процесс тестирования и анализа. Мы также вводим метод критического анализа состояний игры, который позволяет быстро исследовать и анализировать ключевые моменты в игре. #### Результаты Мы провели эксперименты с различными моделями языкового понимания, включая модели с разным количеством параметров. Мы отобрали модели, которые совершенно не требуют дополнительной настройки и имеют широкий диапазон возможностей. Мы также проводили сравнение основных моделей, определяя, какие модели демонстрируют лучший результат в задаче дипломатии. Оказалось, что модели с большим количеством параметров показывают лучшие результаты. Однако мы также обнаружили, что даже модели с меньшим количеством параметров могут выполнять достаточно хорошую работу. Эти результаты позволяют нам понять, как модели языкового понимания могут оценивать сложные ситуации в игре дипломатии. #### Значимость Наш подход демократизирует оценку моделей языкового понимания, позволяя использовать их в задачах, требующих стратегического мышления. Он упрощает процесс тестирования и позволяет проводить сравнение моделей в разных ситуациях. Этот подход также предоставляет новый взгляд на то, какие способности моделей языкового понимания возникают при их обучении на других задачах. Это может привести к новым возможностям в использовании моделей языкового понимания в сложных задачах, требующих с

Annotation:

We present the first evaluation harness that enables any out-of-the-box, local, Large Language Models (LLMs) to play full-press Diplomacy without fine-tuning or specialized training. Previous work required frontier LLMs, or fine-tuning, due to the high complexity and information density of Diplomacy's game state. Combined with the high variance of matches, these factors made Diplomacy prohibitive for study. In this work, we used data-driven iteration to optimize a textual game state representati...

ID: 2508.07485v1 cs.AI, cs.CL, cs.CY, cs.LG

arXiv PDF

📄 Extracting Overlapping Microservices from Monolithic Code via Deep Semantic Embeddings and Graph Neural Network-Based Soft Clustering

2025-08-13

Авторы:

Morteza Ziabakhsh, Kiyan Rezaee, Sadegh Eskandari, Seyed Amir Hossein Tabatabaei, Mohammad M. Ghassemi

## Контекст Современные программные системы стремятся перейти с монолитных архитектур на микросервисные, чтобы улучшить масштабируемость, поддерживаемость и гибкость развертывания. Однако существующие методы экстракции микросервисов часто основываются на жестком кластеринге, при котором каждый компонент присваивается одному микросервису. Это приводит к увеличению взаимозависимости между микросервисами и уменьшению внутрисервисной когерентности. Мы предлагаем фреймворк Mo2oM (Monolithic to Overlapping Microservices), который формулирует задачу экстракции микросервисов как задачу мягкого кластеринга. Это позволяет компонентам принадлежать к нескольким микросервисам с вероятностным характером. Метод Mo2oM использует глубокие семантические отображения и структурные зависимости, извлекаемые из графов вызовов методов, для представления функциональных и архитектурных связей. Далее, мягкий кластеринг на основе графов GNN позволяет формировать оптимальные микросервисы. ## Метод Метод Mo2oM применяет глубокие семантические модели для получения векторных представлений компонентов, а также графы вызовов методов для извлечения структурных зависимостей. Эти данные объединяются в сети нод, где каждая нода представляет собой компонент. Затем, используя GNN, мы вычисляем вероятности принадлежности компонентов к микросервисам. Это позволяет микросервисам иметь нечёткие границы и включать несколько компонентов, что является более естественным для реальных систем. Метод также учитывает архитектурные зависимости, чтобы обеспечить баланс между когерентностью и взаимозависимостью. ## Результаты Мы проверили Mo2oM на четырёх открытых бенчмарках, сравнив его со штатными базовыми алгоритмами. Наши результаты показывают, что Mo2oM улучшает **структурную модулярность** (когерентность и взаимозависимость) на 40.97%, **процент вызовов между микросервисами** (связность) на 58%, **количество интерфейсов** (модулярность и декомпозиция) на 26.16%, и **распределение размеров микросервисов** (эquilibrность) на 38.96%. Эти результаты демонстрируют то, что Mo2oM выдаёт более гармоничные и эффективные микросервисные архитектуры по сравнению с другими подходами. ## Значимость Наш подход может применяться в разработке программных систем, где необходимо найти баланс между модулярностью и взаимозависимостью. Он позволяет улучшить модулярность, уменьшить взаимодействие между микросервисами и сделать размеры микросервисов более балансированными. Эти преимущества могут су

Annotation:

Modern software systems are increasingly shifting from monolithic architectures to microservices to enhance scalability, maintainability, and deployment flexibility. Existing microservice extraction methods typically rely on hard clustering, assigning each software component to a single microservice. This approach often increases inter-service coupling and reduces intra-service cohesion. We propose Mo2oM (Monolithic to Overlapping Microservices), a framework that formulates microservice extracti...

ID: 2508.07486v1 cs.SE, cs.AI, cs.CV

arXiv PDF

📄 From Product Hilbert Spaces to the Generalized Koopman Operator and the Nonlinear Fundamental Lemma

2025-08-13

Авторы:

Mircea Lazar

## Контекст Одним из ключевых направлений в динамических системах является развитие методов, позволяющих линейно интерпретировать нелинейные системы с помощью расширенного оператора КупMана. Этот подход широко применяется в области контроля и прогнозирования динамических процессов. Однако существуют некоторые проблемы: во-первых, необходимо грамотно выбрать основные функции, чтобы линеаризовать нелинейные системы; во-вторых, необходимо развить методы, позволяющие эффективно решать задачи управления в реальном времени. Недостатки текущих методов в том, что они часто либо недостаточно точны, либо неэффективны в сложных системах. Целью данного исследования является развитие методов, позволяющих линеаризовать нелинейные системы с помощью расширенного оператора КупMана и эффективно решать задачи управления в реальном времени. ## Метод Для решения этих проблем, автор предлагает использовать новую методологию на основе произведения гильбертовых пространств. В частности, будет использоваться гильбертово пространство, полученное как произведение пространств, которые описывают состояние и входные данные системы. Для обеспечения линейного представления нелинейных систем будет применена теория гильбертовых пространств и развитие методов данных-драйвенных контроля. Автор также предлагает применение нелинейного фундаментального лейма, который позволит выразить нелинейные зависимости в системе через линейные операции в гильбертовом пространстве. Для реализации этих подходов требуется сбор и обработка больших объемов данных, а также использование методов машинного обучения для оптимизации гильбертовых пространств. ## Результаты Автор предлагает метод, позволяющий представить нелинейные системы в виде линейного оператора в гильбертовом пространстве, полученного как произведение пространств, описывающих состояние и входные данные. Было проведено экспериментальное исследование на примере Van der Pol-осциллятора. Было показано, что применение расширенного оператора КупMана позволяет линеаризовать динамику системы и эффективно решать задачи управления. Также было показано, что применение нелинейного фундаментального лейма позволяет точно описать нелинейные зависимости в системе. ## Значимость Развитые методы имеют широкие применения в динамических системах, в том числе в области контроля и прогнозирования динамических процессов. Они позволяют эффективно решать задачи управления в реальном времени, а также повысить точность прогнозирования динамики нелинейных систем. Это дает возможность развития новых методологий контроля и прогнозирования, которые могут быть применены в различных техни

Annotation:

The generalization of the Koopman operator to systems with control input and the derivation of a nonlinear fundamental lemma are two open problems that play a key role in the development of data-driven control methods for nonlinear systems. Both problems hinge on the construction of observable or basis functions and their corresponding Hilbert space that enable an infinite-dimensional, linear system representation. In this paper we derive a novel solution to these problems based on orthonormal e...

ID: 2508.07494v1 math.OC, cs.AI

arXiv PDF

📄 VA-Blueprint: Uncovering Building Blocks for Visual Analytics System Design

2025-08-13

Авторы:

Leonardo Ferreira, Gustavo Moreira, Fabio Miranda

## Контекст Создание и развитие визуальных аналитических (VA) систем является сложной и итеративной задачей, требующей идеального синтеза обработки данных, аналитических способностей и визуализационных техник. Хотя ранее уже исследовались социальные и коллаборативные аспекты разработки VA-систем, практические вызовы на этапе их разработки остаются недостаточно изученными. Тем не менее, количество VA-систем возрастает, но остается ограниченным число структурированных знаний, которые могли бы подкрепить их разработку и модернизацию. Для примирения этой проблемы предлагается VA-Blueprint — методология и база знаний, которая систематически обзорит и классифицирует основные блоки VA-систем, особо значимой областью из-за сложности данных и уникальных задач. Эта подход был применен к первоначальному набору 20 систем, чтобы сформировать инициальную базу знаний и создать "синтаксис" для разработки VA-систем. Для масштабирования этого подхода, был использован глубокое обучение для автоматизации извлечения компонентов из дополнительных 81 статей (в итоге получился корпус из 101 статей), чтобы оценить эффективность метода в построении базы знаний. В итоге, этот подход позволяет лучше понять структуру VA-систем и создать базу для более структурированной, повторяемой и эффективной разработки. ## Метод Методология VA-Blueprint основывается на следующих шагах: 1. **Изучение предметной области**: Анализ и отбор систем в области визуальных анализов, особо значимых для экспертов и практиков. 2. **Классификация компонентов**: Разработка многоуровневой системы классификации, позволяющей разделить системы на базовые элементы (например, источники данных, аналитические модели, визуальные представления). 3. **Использование машинного обучения**: Использование глубокого обучения для автоматизации процесса извлечения компонентов из документов, что позволяет масштабировать базу знаний. 4. **Оценка эффективности**: Использование экспертных интервью и метрик аннотации для проверки качества работы алгоритмов. Таким образом, VA-Blueprint предлагает структурированный подход к построению визуальных аналитических систем, который может быть использован для различных сфер применения. ## Результаты Применение VA-Blueprint к первоначальному набору 20 систем позволило выделить и структурировать основные компоненты VA-систем в многоуровневую систему. Эти компоненты были потом автоматически извлечены из дополнительных 81 статей, чтобы расширить базу знаний до 101 систем. Экспертные интервью показали, что методология эффективно работает для категоризации систем и позволяет выявить потенциальные улучш

Annotation:

Designing and building visual analytics (VA) systems is a complex, iterative process that requires the seamless integration of data processing, analytics capabilities, and visualization techniques. While prior research has extensively examined the social and collaborative aspects of VA system authoring, the practical challenges of developing these systems remain underexplored. As a result, despite the growing number of VA systems, there are only a few structured knowledge bases to guide their de...

ID: 2508.07497v1 cs.HC, cs.AI

arXiv PDF

📄 Intersectoral Knowledge in AI and Urban Studies: A Framework for Transdisciplinary Research

2025-08-13

Авторы:

Rashid Mushkani

## Контекст Трансдисциплинарные подходы ad hoc стремятся решать глобальные задачи социального характера, особенно в области Искусственного Интеллекта (ИИ), городских градостроительных процессов и социальных наук. Однако интеграция знаний из различных дисциплин остается трудной задачей. Особенностью этого доклада является рассмотрение этой проблемы через призму социально-социальных знаний и интеллектуальных процессов, которые взаимодействуют в рамках ИИ и градостроительных проектов. Основная цель — разработать новую трансдисциплинарную модель, которая позволит лучше понять интеллектуальные процессы, взаимодействующие с социальным миром. На практике это может быть использовано для развития новых моделей того, как системы ИИ могут участвовать в решении социальных проблем. ## Метод Методология основывается на трансдисциплинарном подходе, который включает классификацию и анализ доносительных знаний с помощью различных критериев. Исследователю предлагается использовать метод актуализации эмпирических данных, применяя множество фильтров и критериев подбора. Архитектура модели включает в себя классификационную структуру, использующую критерии: - **Онтологические** (философия объекта исследования); - **Эпистемологические** (знания и методы их получения); - **Методологические** (методы исследования); - **Телеологические** (цели исследования); - **Аксиологические** (ценности и ценностные ориентации); - **Валидационные** (методы валидации знаний). ## Результаты Исследователь осуществляет классификацию и анализ статей, полученных в течение десятилетия (2014–2024), которые наиболее активно применяются в ИИ и городских исследованиях. При этом применяется ключевый подход к классификации знаний в рамках шести описанных критериев. Результаты показывают, что наиболее часто используются подходы, основанные на критическом реализме (онтология), позитивизме (эпистемология), аналитических методах (методология), консклюэнциализме (телеология), эпистемических знаниях (аксиология) и социально-экономическому ценностному ориентиру (валидация). Редкие ориентации, такие как идеализм, смешанные методы и культурная валидация, также были отобраны, и их потенциал в развитии знаний был оценен. ## Значимость Предлагаемая модель может применяться в различных областях, таких как городское планирование, ИИ, социальные науки, и улучшать интеллектуальные процессы в решении социальных проблем. Ее преимущества заключаются в том, что она позволя

Annotation:

Transdisciplinary approaches are increasingly essential for addressing grand societal challenges, particularly in complex domains such as Artificial Intelligence (AI), urban planning, and social sciences. However, effectively validating and integrating knowledge across distinct epistemic and ontological perspectives poses significant difficulties. This article proposes a six-dimensional framework for assessing and strengthening transdisciplinary knowledge validity in AI and city studies, based o...

ID: 2508.07507v1 cs.CY, cs.AI

arXiv PDF

📄 From Field to Drone: Domain Drift Tolerant Automated Multi-Species and Damage Plant Semantic Segmentation for Herbicide Trials

2025-08-13

Авторы:

Artzai Picon, Itziar Eguskiza, Daniel Mugica, Javier Romero, Carlos Javier Jimenez, Eric White, Gabriel Do-Lago-Junqueira, Christian Klukas, Ramon Navarra-Mestre

**Резюме** Развитие агротехнологий позволяет автоматизировать сложные процессы мониторинга поля и оценки эффективности химикатов. Однако традиционные методы ручного визуального анализа остаются временными и субъективными. Мы предлагаем усовершенствованную модель сегментации, которая объединяет общеприменный самостоятельно обучающийся визуальный модуль с иерархическим выводом на основе ботанической системы классификации. Модель была обучена на большом многолетнем датасете (2018–2020 гг., Германия и Испания) и тестировалась на данных цифровых и мобильных камер (2023 г.), а также дроновых изображений (2024 г.) с различных географических областей. Модель достигла существенных улучшений в идентификации видов растений (F1-метрика: от 0.52 до 0.85) и оценки вреда (F1-метрика: от 0.28 до 0.44) по сравнению с предыдущими подходами. Несмотря на достаточную стабильность при переходе между устройствами, подвиды дронных изображений вызвали деградацию результатов (F1-метрика: 0.60, R²: 0.80; вреда: 0.41, R²: 0.62). Несмотря на это, модель показала приемлемую стойкость в реальных условиях и была успешно развернута в цифровой инфраструктуре BASF, где она поддерживает процессы мониторинга растений и оценки эффективности химикатов.

Annotation:

Field trials are vital in herbicide research and development to assess effects on crops and weeds under varied conditions. Traditionally, evaluations rely on manual visual assessments, which are time-consuming, labor-intensive, and subjective. Automating species and damage identification is challenging due to subtle visual differences, but it can greatly enhance efficiency and consistency. We present an improved segmentation model combining a general-purpose self-supervised visual model with h...

ID: 2508.07514v1 cs.CV, cs.AI

arXiv PDF

📄 Word Clouds as Common Voices: LLM-Assisted Visualization of Participant-Weighted Themes in Qualitative Interviews

2025-08-13

Авторы:

Joseph T. Colonel, Baihan Lin

## Контекст Область визуализации и анализа текстовых данных широко используется в исследованиях, предоставляя визуальные инструменты для выявления интересных моделей и отношений в данных. Одной из популярных техник является использование **word clouds**, которые агрегируют слова по частоте их использования. Однако в контексте квалитиативных интервью эти методы часто оказываются неэффективными. Они переоценивают нерелевантные слова, не учитывают парафразы и разбивают семантически связанные идеи на независимые фрагменты. В результате, данные могут быть представлены неточно, что снижает эффективность в ранней стадии анализа. Это ставит перед исследователями задачу развития более точных и интерактивных визуальных методов. ## Метод **ThemeClouds** — это инструмент, основанный на генеративных моделях языка (LLMs), который предлагает новую логику визуализации темы в квалитиативных интервью. Он оптимизирует традиционные подходы, используя LLM для идентификации тем на уровне понятий в тексте. Вместо того, чтобы только подсчитывать частоту слов, ThemeClouds рассчитывает, сколько уникальных участников упоминает каждую тему. Это дает более точное представление о важности темы в контексте всего интервью. Инструмент позволяет исследователям настраивать настройки визуализации и проводить прозрачный анализ. Это делает инструмент гибким и пригодным для различных исследовательских задач. ## Результаты На основе интервью пользователей, проводивших эксперимент с различными конфигурациями звукового прибора (31 участника, 155 транскриптов), ThemeClouds продемонстрировал вышеперечисленные преимущества. Сравнивая его с традиционными методами, такими как LDA и BERTopic, ThemeClouds показал более точное отображение реальных предпочтений участников. Он отфильтровал нерелевантные слова и объединил семантически связанные темы, что упростило интерпретацию результатов. Это демонстрирует мощь глубокого обучения в предоставлении более точных и интерактивных визуализаций. ## Значимость ThemeClouds может быть применен в различных областях, где требуется анализ квалитиативных данных, включая исследования в области медицины, образования, IT и т.д. Он предоставляет более точное представление частоты тем и позволяет исследователям быстрее узнавать основные модели в данных. Также он может быть полезен для создания интерактивных визуальных анализов, которые позволяют проводить подробные кросс-условий сравнения. ## Выводы ThemeClouds представляет собой современный подход к визуализации квалитиативных интервью, используя глубокое обучение для улучшения точности и понятности данных. Он обесп

Annotation:

Word clouds are a common way to summarize qualitative interviews, yet traditional frequency-based methods often fail in conversational contexts: they surface filler words, ignore paraphrase, and fragment semantically related ideas. This limits their usefulness in early-stage analysis, when researchers need fast, interpretable overviews of what participant actually said. We introduce ThemeClouds, an open-source visualization tool that uses large language models (LLMs) to generate thematic, partic...

ID: 2508.07517v1 cs.CL, cs.AI, cs.HC

arXiv PDF

1
2
1403
1404
1405
1406
1407
1482
1483

Показано 14041 - 14050 из 14827 записей