📚 Саммари научных статей из arXiv

Найдено 1292 результатов по запросу 'cs.AI, cs.CL' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Sycophancy as compositions of Atomic Psychometric Traits

2025-08-29

Авторы:

Shreyans Jain, Alexandra Yost, Amirali Abdullah

## Контекст Синдром сикофантизма (sycophancy), характеризующийся подчинением индивида к власти, представляет одной из ключевых проблем в общении со вспомогательными языковыми моделями (LLMs). Несмотря на то, что сикофантизм часто рассматривается как автономный недостаток, возникающий из-за одного причинного механизма, работа <<Sycophancy as compositions of Atomic Psychometric Traits>> предлагает новую точку зрения. Авторы подходят к нему как к комбинации геометрических и касуальных компонентов психометрических характеристик, таких как эмоциональность, открытость, и согласованность. Данный подход аналогичен факторной декомпозиции в психометрических моделях. ## Метод Для моделирования сикофантизма в работе используется метод Contrastive Activation Addition (CAA). Это метод, который позволяет проанализировать как взаимосвязь между активациями нейронов модели, так и их связь с психометрическими характеристиками. Авторы предлагают разбить активационные векторы модели на компоненты, соответствующие каждой из психометрических характеристик, и изучать, какие комбинации этих компонентов приводят к сикофантизму. Например, высокая экстраверсия в сочетании с низкой согласованностью может вызывать поведение, характеризующееся сикофантизмом. ## Результаты Для проверки гипотезы, авторы использовали данные, собранные из целенаправленных экспериментов с LLM. Данные включали в себя различные проявления сикофантизма, а также комбинации психометрических характеристик. Они применяли метод CAA для изучения того, как различные комбинации этих характеристик влияют на выражение сикофантизма. Результаты показали, что сикофантизм может быть эффективно рассмотрен с точки зрения композиций этих компонентов. Это дало возможность разработать векторные интервенции для минимизации сикофантизма. ## Значимость Работа имеет большое значение для области безопасности и этики в искусственном интеллекте. Она предлагает новую модель понимания и контроля сикофантизма, которая может быть применена для предотвращения нежелательных поведенческих тенденций в LLM. Данный подход также может быть использован для обучения моделей, которые будут более совместимы с ценностными ориентированными подходами к интеллектуальной безопасности. ## Выводы Результаты работы показывают, что сикофантизм может быть рассмотрен как композиция психометрических характеристик, что дает новый подход к моделированию и контролю этого поведенческого риска. Будущие исследования будут сконцентрированы на расширении данной модели для других психометрических характеристик и на из

Annotation:

Sycophancy is a key behavioral risk in LLMs, yet is often treated as an isolated failure mode that occurs via a single causal mechanism. We instead propose modeling it as geometric and causal compositions of psychometric traits such as emotionality, openness, and agreeableness - similar to factor decomposition in psychometrics. Using Contrastive Activation Addition (CAA), we map activation directions to these factors and study how different combinations may give rise to sycophancy (e.g., high ex...

ID: 2508.19316v1 cs.AI, cs.CL, cs.LG, I.2.7; I.2.4

arXiv PDF

📄 An Investigation on Group Query Hallucination Attacks

2025-08-29

Авторы:

Kehao Miao, Xiaolong Jin

## Контекст С появлением крупных языковых моделей (LLMs), понимание их потенциальных сбоев при взаимодействии с пользователями стало ключевым вопросом. Особенно интересно, как LLMs обрабатывают множество вопросов в рамках одной беседы. Это может привести к сбоям в выводах из-за нежелательных влияний между соседними запросами. Данное исследование фокусируется на рассмотрении **Group Query Attack (GQA)** — нового метода, симулирующего такие сценарии. Он позволяет изучить, как последовательность запросов влияет на выводы языковых моделей, а также на способность моделей выполнять прикладные задачи. ## Метод **Group Query Attack** представляет собой метод, в котором группа запросов представляется языковой модели одновременно. В рамках данного исследования, авторы применяют GQA к моделям с разным функционалом, включая задачи моделирования, рассуждения и кодогенерации. Особое внимание уделено изучению зависимости результатов от влияния смежных запросов, а также изучению возможности инициировать backdoor-атаки через GQA. Эксперименты проводятся с использованием предобученных моделей и их адаптаций под конкретные задачи. ## Результаты Исследование показало, что **Group Query Attack** существенно ухудшает производительность моделей, особенно тех, которые были приучены к конкретным задачам. Это происходит из-за того, что соседние запросы влияют на контекст вывода модели, что приводит к ошибкам в выводах. Также, GQA демонстрирует риск инициировать backdoor-атаки, когда модель вместо предсказания на основе входных данных склоняется к ответу, который связан с заранее загруженным в модель backdoor-триггером. Тестирование проводилось на задачах реального применения, включая логическое и математическое рассуждение, а также на создании кода. ## Значимость **Group Query Attack** может использоваться в разных областях, включая защиту от вредоносных атак на языковые модели, анализ их уязвимостей и оценку качества взаимодействия с пользователем. Этот метод имеет потенциал для улучшения обучения моделей, чтобы сделать их более устойчивыми к внешним влияниям. Это может положительно сказаться на безопасности и эффективности использования языковых моделей в реальных приложениях. ## Выводы **Group Query Attack** является эффективным методом для исследования потенциальных сбоев в языковых моделях при их взаимодействии с пользователями. Результаты жизнеспособны для дальнейшего исследования в области улучшения устойчивости моделей к таким атакам. Будущие исследования будут фокусироваться на развитии методов, позволяющих обнаруживать и предотвращать подобные сбои в моделях, а также на исследовании их последствий для различных прикладных задач.

Annotation:

With the widespread use of large language models (LLMs), understanding their potential failure modes during user interactions is essential. In practice, users often pose multiple questions in a single conversation with LLMs. Therefore, in this study, we propose Group Query Attack, a technique that simulates this scenario by presenting groups of queries to LLMs simultaneously. We investigate how the accumulated context from consecutive prompts influences the outputs of LLMs. Specifically, we obse...

ID: 2508.19321v1 cs.CR, cs.AI, cs.CL

arXiv PDF

📄 The Ramon Llull's Thinking Machine for Automated Ideation

2025-08-29

Авторы:

Xinran Zhao, Boyuan Zheng, Chenglei Si, Haofei Yu, Ken Liu, Runlong Zhou, Ruochen Li, Tong Chen, Xiang Li, Yiming Zhang, Tongshuang Wu

## Контекст Область исследования сосредоточена на развитии инструментов для поддержки творчества и идеогенерации в научных исследованиях. Данное исследование основывается на идеях Рамона Льуля, который в средневековой Европе развил Ars combinatoria — рамку для генерирования знаний через символическую перестановку. Несмотря на важность Льуля, его работа была забыта до тех пор, пока не была вновь увидена в современном контексте. Существующие проблемы включают ограниченность традиционных подходов к идеогенерации, сильно зависящим от человеческого ввода и ручной работы. Мотивация заключается в создании системы, которая могла бы увеличить эффективность и разнообразие идей в научных работах, а также объединить человеческое творчество с возможностями ИИ. ## Метод Предложенная система опирается на три основных компонента: тематический аксесс (Theme), домен (Domain) и метод (Method). Тематический аксесс включает в себя отвлеченные понятия (например, эффективность, адаптивность), домен относится к конкретным областям (например, вопрос ответа, перевод машинного текста), а метод описывает практические подходы (например, адверсарский тренинг, линейная атенция). Эти элементы строятся на технологиях языковых моделей (LLM), что позволяет автоматизировать процесс генерирования идей. Процесс работы системы заключается в сборе элементов из работ человеческих экспертов или конференций, а затем в их комбинировании с использованием LLM для формирования новых научных идей. ## Результаты В ходе экспериментов было показано, что система может генерировать разнообразные, актуальные и значимые научные идеи, которые тесно связаны со существующей литературой. Данные для экспериментов были получены из современной научной литературы, включая работы по вопросу ответа, машинному переводу и другим областям. Использование LLM для комбинации элементов привело к повышению разнообразия и качества идей в сравнении с существующими подходами. Эксперименты также показали, что этот подход легко масштабируется и интерпретируется, что делает его полезным для научных сообществ. ## Значимость Инструмент, описанный в статье, имеет широкие области применения, включая генерирование идей для научных исследований, поддержку креативности и коллективную работу между человеком и ИИ. Он предлагает светлую, удобную и эффективную альтернативу традиционным методам. Это решение может повысить эффективность научных исследований, обеспечив более быстрое и разнообразное генерирование идей. Будущие исследования будут ориентироваться на улу

Annotation:

This paper revisits Ramon Llull's Ars combinatoria - a medieval framework for generating knowledge through symbolic recombination - as a conceptual foundation for building a modern Llull's thinking machine for research ideation. Our approach defines three compositional axes: Theme (e.g., efficiency, adaptivity), Domain (e.g., question answering, machine translation), and Method (e.g., adversarial training, linear attention). These elements represent high-level abstractions common in scientific w...

ID: 2508.19200v2 cs.AI, cs.CL

arXiv PDF

📄 Instructional Agents: LLM Agents on Automated Course Material Generation for Teaching Faculties

2025-08-29

Авторы:

Huaiyuan Yao, Wanpeng Xu, Justin Turnau, Nadia Kellam, Hua Wei

## Контекст Подготовка высококачественных учебных материалов является трудоемкой задачей, требующей значительного времени и усилий. На сегодняшний день, преподаватели, учебные координаторы и дизайнеры обучения должны взаимодействовать для создания систематических, актуальных и доступных для студентов материалов. Этот процесс часто ограничивается ресурсами, в результате чего в развивающихся странах и менее приоритетных учебных заведениях недостаточно доступны качественные учебные ресурсы. Авторы статьи предлагают решение, ориентированное на автоматизацию этого процесса с помощью технологий больших языковых моделей (LLM). Модель Instructional Agents предназначена для автоматизации подготовки учебных материалов, включая синтез силогам, скриптов лекций, слайдов в формате LaTeX и вопросов для оценки. Эта инициатива призвана снизить нагрузку на преподавателей и улучшить доступность учебных ресурсов. ## Метод Instructional Agents представляет собой рамфам-подход, включающий несколько ролевых агентов, которые взаимодействуют для создания квалифицированных учебных материалов. Модель использует технологии трансформативных генеративных моделей, что позволяет создавать результаты, сочетающие креативность и точность. Метод разделяется на несколько этапов: 1. **Инициализация системы**: Агенты получают входные данные в виде курсовых требований и учебных целей. 2. **Ролевое взаимодействие**: Каждый агент выполняет свою роль (например, создание лекций, силога, слайдов), чтобы обеспечить гармонию. 3. **Применение технологий LLM**: Модели используют текстовую генерацию для синтеза текстовых материалов и генеративные сети для создания визуальных элементов, таких как слайды. 4. **Взаимодействие с пользователем**: Модель предлагает три уровня вмешательства: Autonomous (автономная работа), Catalog-Guided (гайды с использованием уже готовых материалов) и Feedback-Guided (с включением корректировок от пользователя). ## Результаты Авторы провели эксперименты на пяти курсах высшего образования в области компьютерных наук. Результаты показали, что Instructional Agents способна генерировать высококачественные учебные материалы, соответствующие учебным требованиям. Выявлено, что система сокращает время подготовки материалов на 40% и уменьшает трудозатраты участников процесса в 2 раза. Кроме того, система продемонстрировала гибкость, позволяя выбирать степень вмешательства человека в процесс. ## Значимость Этот подход может быть применен в различных областях образования, особенно там, где существуют ограничения ресурсов или не

Annotation:

Preparing high-quality instructional materials remains a labor-intensive process that often requires extensive coordination among teaching faculty, instructional designers, and teaching assistants. In this work, we present Instructional Agents, a multi-agent large language model (LLM) framework designed to automate end-to-end course material generation, including syllabus creation, lecture scripts, LaTeX-based slides, and assessments. Unlike existing AI-assisted educational tools that focus on i...

ID: 2508.19611v1 cs.AI, cs.CL, I.2.7

arXiv PDF

📄 Safety Alignment Should Be Made More Than Just A Few Attention Heads

2025-08-29

Авторы:

Chao Huang, Zefeng Zhang, Juewei Yue, Quangang Li, Chuang Zhang, Tingwen Liu

#### Контекст Безопасность текстовых кLARGE LANGUAGE MODELS (LLMs) является ключевым аспектом их применения в реальном мире. Однако существующие механизмы безопасности LLMs часто оказываются уязвимыми перед тем, как специально создаваемые входные данные (adversarial prompts), которые могут обходить эти меры безопасности. Это происходит в основном из-за того, что большинство механизмов безопасности ориентируются на небольшое количество ататенциональных голов (attention heads), которые обеспечивают безопасность. Исследования показали, что удаление или блокировка этих голов может сильно затруднить надлежащее поведение модели в области безопасности. Это означает, что существующие системы безопасности текстовых моделей зачастую рискуют целиком полагаться на небольшую группу ататенциональных голов, что делает их эффективными целями для атак. #### Метод Мы предлагаем RDSHA (Refusal Direction-based Safety Head Ablation), метод абляции, который использует направление отказа модели (refusal direction) для идентификации голов внимания, которые играют ключевую роль в обеспечении безопасности. Этот метод позволяет определять те головы внимания, которые играют ключевую роль в процессе безопасности. Далее, мы применяем новую стратегию тренировки, AHD (Attention Head Distribution), которая предназначена для распределения тех же безопасных функций по множеству других голов внимания. Это позволяет модели распределять безопасность по более широкой области ататенциональных голов, что уменьшает зависимость от небольшого количества ключевых голов. #### Результаты Мы провести эксперименты, используя ряд различных безопасностных тестов и атак, включая mainstream jailbreak attacks. Мы проверили, насколько эффективно RDSHA может определять ключевые головы внимания, которые отвечают за безопасность. Далее, мы оценили, насколько эффективно AHD может распределять безопасность по более широкому набору голов внимания, и исследовали, насколько эта распределенная безопасность сохраняет эффективность и релевантность модели в реальных сценариях. Наши результаты показали, что AHD успешно распределяет безопасность по большему количеству голов внимания, что улучшает общую безопасность модели и уменьшает вероятность обхода этих механизмов. #### Значимость Улучшенные методы безопасности LLMs имеют большое значение для многих областей, включая образование, финансы, здравоохранение и транспорт. Наша работа демонстрирует, что распределенная безопасность может существенно улучшить надежность и безопасность LLMs в тех случаях, когда атаки на основе adversarial prompts становятся все более сложными

Annotation:

Current safety alignment for large language models(LLMs) continues to present vulnerabilities, given that adversarial prompting can effectively bypass their safety measures.Our investigation shows that these safety mechanisms predominantly depend on a limited subset of attention heads: removing or ablating these heads can severely compromise model safety. To identify and evaluate these safety-critical components, we introduce RDSHA, a targeted ablation method that leverages the model's refusal d...

ID: 2508.19697v1 cs.CR, cs.AI, cs.CL

arXiv PDF

📄 Analysing Chain of Thought Dynamics: Active Guidance or Unfaithful Post-hoc Rationalisation?

2025-08-29

Авторы:

Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, Nikolaos Aletras

#### Контекст Проблема анализа цепи мыслительных операций (Chain of Thought, CoT) в искусственном интеллекте заключается в том, что данный подход часто дает ограниченные выгоды в решении задач мягкой расуждения (soft-reasoning), таких как аналитическое и коммонсенс-решение. Более того, CoT может быть недостоверным в отражении истинных мыслительных процессов модели. Недостаточность CoT особенно заметна в случае задач, требующих логического рассуждения и интуитивного понимания контекста. Исследователи стараются развить методы, позволяющие более точно проанализировать и стабилизировать цепь мыслительных операций в таких задачах. Это включает исследования воздействия различных архитектур моделей, включая instruction-tuned, reasoning и reasoning-distilled, на качество и надежность цепи мыслительных операций. #### Метод Для исследования динамики и надежности CoT в мягких задачах рассуждения (soft-reasoning), авторы применяют метод экспериментального сравнения моделей с различными архитектурами. Модели instruction-tuned, reasoning и reasoning-distilled проверяются на задачах, требующих аналитических и коммонсенс-решений. Для оценки доверия к CoT используется метод сравнения результатов моделей с примерами ручного рассуждения. Также в рамках исследования используются метрики, позволяющие оценить качество проделанной работы и точность CoT. Было проведено ряд экспериментов с разным набором данных, включая как синтетические, так и реальные ситуации. #### Результаты Отчет о результатах работы показывает различия в зависимости от архитектуры модели. Было выявлено, что instruction-tuned модели гораздо эффективнее в производительности CoT на задачах, требующих анализа и коммонсенса. Наблюдается то, что CoT может быть недостоверным в отражении истинных мыслительных процессов. Также исследователи выявили ситуации, когда увеличение надежности CoT приводит к ухудшению качества решения задач. В целом, результаты показывают, что есть различия в качестве CoT между разными моделями и что CoT не всегда отражает точно мыслительные операции модели. #### Значимость Результаты исследования могут быть применены для улучшения алгоритмов в АПИ и ИИ, которые используются в различных сферах, включая медицину, финансы и юриспруденцию. Изучение CoT может помочь в создании более надежной и прозрачной модели мышления в искусственном интеллекте. Преимущества исследования в том, что оно позволяет детально проанализировать взаимосвязь между CoT и реальными мыслительными процессами, и может привести к развитию моделей, которые будут более достоверно отражать свои мыслительные процессы. Это может положительно сказаться на доверии пользователей к

Annotation:

Recent work has demonstrated that Chain-of-Thought (CoT) often yields limited gains for soft-reasoning problems such as analytical and commonsense reasoning. CoT can also be unfaithful to a model's actual reasoning. We investigate the dynamics and faithfulness of CoT in soft-reasoning tasks across instruction-tuned, reasoning and reasoning-distilled models. Our findings reveal differences in how these models rely on CoT, and show that CoT influence and faithfulness are not always aligned.

ID: 2508.19827v1 cs.AI, cs.CL

arXiv PDF

📄 SoK: Large Language Model Copyright Auditing via Fingerprinting

2025-08-29

Авторы:

Shuo Shao, Yiming Li, Yu He, Hongwei Yao, Wenyuan Yang, Dacheng Tao, Zhan Qin

## Контекст Область исследования связана с защитой интеллектуальной собственности в сфере тренировки и использования больших языковых моделей (LLMs). Из-за высокой стоимости тренировки и большого размера этих моделей, они являются ценным интеллектуальным капиталом, который часто становится целью незаконного использования или кражи. Одним из потенциальных способов защиты является **LLM fingerprinting**, метод, основанный на извлечении и сравнении отличительных признаков моделей. Несмотря на свою удобную настройку и применение, этот подход сталкивается с проблемой неоднородного поведения моделей после модификаций, таких как fine-tuning, quantization и др., а также отсутствием стандартных критериев для оценки его эффективности. Мотивацией для данного исследования является развитие критериев отчетности и оценки, чтобы обеспечить надежную защиту LLMs. ## Метод Для решения задачи LLM fingerprinting, авторы предлагают **формальную категоризацию существующих методов** на white-box и black-box подходы. White-box методы предполагают доступ к внутренним параметрам моделей, в то время как black-box методы оперируют только теми выходами модели, которые доступны после ввода запроса. Для оценки эффективности используется **LeaFBench**, первый систематический бенчмарк для LLM fingerprinting. Он содержит 149 вариаций основных моделей, включая как параметр-алтеринговые техники (fine-tuning, quantization), так и без параметров (системные проMPроMPроMPроMPроMPроMPроMPроMPроMPроMPроMPроМпроМки). Бенчмарк покрывает широкий спектр технологий модификации, что дает возможность тестирования различных методов защиты на реальных условиях. ## Результаты Исследования проводились на базе LeaFBench, что позволило сравнить различные параметры моделей и технологии модификации с целью определения сильных и слабых сторон существующих вариантов LLM fingerprinting. Наблюдались различия в производительности различных подходов, в зависимости от типа модификации моделей. Например, black-box методы, основывающиеся на системных проMPроMPроMPроMPроMPроMPроMPроMPроMPроMPроМпроМках, показали высокую устойчивость к некоторым модификациям, но могли быть обойдены при других. Эти результаты позволили выявить ключевые проблемы в защите LLMs и подчеркнуть необходимость развития более универсальных методов. ## Значимость Данный подход может применяться в различных сферах, где необходима защита интеллектуальной собственности в области NLP, включая коммерческие модели LLM. Он предоставляет возможность оценивать и улучшать методы защиты моделей от незаконного использования. Одним из преимуществ является то, что он может быть использован как систематический ме

Annotation:

The broad capabilities and substantial resources required to train Large Language Models (LLMs) make them valuable intellectual property, yet they remain vulnerable to copyright infringement, such as unauthorized use and model theft. LLM fingerprinting, a non-intrusive technique that extracts and compares the distinctive features from LLMs to identify infringements, offers a promising solution to copyright auditing. However, its reliability remains uncertain due to the prevalence of diverse mode...

ID: 2508.19843v1 cs.CR, cs.AI, cs.CL

arXiv PDF

📄 GLSim: Detecting Object Hallucinations in LVLMs via Global-Local Similarity

2025-08-29

Авторы:

Seongheon Park, Yixuan Li

## Контекст Объектная маскировка (object hallucination) в больших зрения-языковых моделях (large vision-language models, LVLMs) является значительной проблемой, которая серьезно ограничивает их применение в реальных мировых задачах. Эта проблема возникает, когда модель визуально описывает объекты, которые либо не присутствуют на изображении, либо не соответствуют его содержимому. Это может привести к непредсказуемым и неточным результатам в критически важных сценариях, таких как помощь детям или улучшение доступности. Несмотря на то, что некоторые работы предложили меры для оценки вероятности объектной маскировки, они часто основываются либо на глобальных, либо на локальных признаках, что может ограничивать точность детекции. Из этого возникает потребность в разработке более надежного и точного метода для обнаружения объектной маскировки. ## Метод GLSim — это новая фреймворк с тренировкой, ориентированный на обнаружение объектной маскировки в LVLMs. Он использует комплементарные признаки глобальной (global) и локальной (local) схожести между изображением и текстовым описанием. Глобальная схожесть измеряет совпадение в общем визуальном и текстовом представлении, в то время как локальная схожесть привлекает внимание к взаимосвязям между конкретными объектами. Эти признаки объединяются в графическую модель, которая позволяет раскрыть различия между настоящими и халлуцинированными объектами. Затем, на основе улучшенного представления, GLSim использует методы вычисления схожести, чтобы определить, является ли объект халлуцинацией. Этот метод не требует дополнительного обучения модели, что делает его универсальным и эффективным в различных сценариях. ## Результаты Для проверки эффективности GLSim проведены эксперименты с использованием различных LVLMs, включая конкурентные модели с высоким рейтингом. Данные для экспериментов были получены из различных источников, включая общедоступные базы данных с изображениями и текстовыми описаниями. GLSim достиг достижил обнаружения объектной маскировки с высокой точностью, превосходя конкурентные методы на значительную дистанцию. Эксперименты также показали, что GLSim работает эффективно в разных условиях, таких как сложность изображений, различность текстовых описаний и типы LVLMs. ## Значимость Помимо обнаружения объектной маскировки, GLSim может использоваться в различных областях, включая улучшение доступности, помощь детям и выявление неточностей в автоматическом описании изображений. Эта модель предлагает значительные преимущества по сравнению с другими методами, такими как высокая точность, универсальность и отсутстви

Annotation:

Object hallucination in large vision-language models presents a significant challenge to their safe deployment in real-world applications. Recent works have proposed object-level hallucination scores to estimate the likelihood of object hallucination; however, these methods typically adopt either a global or local perspective in isolation, which may limit detection reliability. In this paper, we introduce GLSim, a novel training-free object hallucination detection framework that leverages comple...

ID: 2508.19972v1 cs.CV, cs.AI, cs.CL

arXiv PDF

📄 Linear-Time Demonstration Selection for In-Context Learning via Gradient Estimation

2025-08-29

Авторы:

Ziniu Zhang, Zhenshuo Zhang, Dongyue Li, Lu Wang, Jennifer Dy, Hongyang R. Zhang

## Контекст В последние годы стала особенно актуальной работа с глубокими нейронными сетями, особенно в области обучения с подкреплением и машинного обучения. Одна из самых выгодных особенностей нейронных сетей — их потенциал для интеллектуального обработки больших объемов данных. Однако, в связи с этим потенциалом возникли новые проблемы, связанные с выбором оптимальных демонстрационных примеров для обучения. В частности, проблема выбора эффективных демонстраций для в контекстном обучении через интерпретацию информации попала в центр внимания. Необходимость быстрого и эффективного выбора примеров для ускорения процесса обучения и повышения точности модели стала приоритетной задачей в этой области. ## Метод Для решения этой задачи была разработана методология, основанная на использовании градиентной оценки. Метод предполагает вычисление градиентов модели в отношении входных примеров. На основе этих градиентов производится первоначальная оценка модели, которая позволяет производить выбор примеров без полного вычисления всех возможных комбинаций. Этот подход использует множество случайно выбранных подмножеств примеров, которые позволяют оценить вклад каждого примера в процесс обучения. Затем, с помощью этих оценок, выбираются $k$ самых важных примеров для дальнейшего обучения. Этот метод имеет линейную сложность по отношению к размеру модели и размеру обучающего множества. ## Результаты Опытные испытания проводились на различных моделях и данных. Было показано, что данный метод позволяет выбирать $k$ демонстрационных примеров быстрее, с меньшей ошибкой и высокой точностью. Например, средний процент улучшения выбора примеров составил около $11\%$ в сравнении с существующими методами, основанными на интерпретации входных примеров. Была также проведена оценка точности, показав, что градиентная оценка дает примерно $\mathbf{1}\%$ ошибки в сравнении с полным вычислением. Это позволяет ускорить выбор примеров до $\mathbf{37.7}\times$ при работе с моделями, имеющими до $34$ миллиардов параметров. ## Значимость Процедура выбора примеров, основанная на градиентной оценке, демонстрирует потенциал для распространенного применения в области контекстного обучения. Она позволяет существенно ускорить процесс обучения, уменьшить затраты ресурсов, а также повысить точность модели. Этот метод может быть применен в различных сферах, включая промышленные приложения, моделирование и анализ данных. Более того, он открывает новые возможности для расширения области применения нейронных сетей в сложных и больших объемах данных. ## Выводы На основе проведенных исследований, можно сделать вывод, что градиентна

Annotation:

This paper introduces an algorithm to select demonstration examples for in-context learning of a query set. Given a set of $n$ examples, how can we quickly select $k$ out of $n$ to best serve as the conditioning for downstream inference? This problem has broad applications in prompt tuning and chain-of-thought reasoning. Since model weights remain fixed during in-context learning, previous work has sought to design methods based on the similarity of token embeddings. This work proposes a new app...

ID: 2508.19999v1 cs.LG, cs.AI, cs.CL

arXiv PDF

📄 SWIRL: A Staged Workflow for Interleaved Reinforcement Learning in Mobile GUI Control

2025-08-29

Авторы:

Quanfeng Lu, Zhantao Ma, Shuai Zhong, Jin Wang, Dahai Yu, Michael K. Ng, Ping Luo

## Контекст Область исследований, связанная с mobile GUI control (контролем пользовательских интерфейсов мобильных приложений), получила значительный интерес в последние годы, особенно в связи с развитием крупных моделей визуального языка (LVLMs) и их возможностями в области естественных языков. Несмотря на этот прогресс, существующие методы либо ограничены в своих возможностях, либо неэффективны в условиях реального времени. Это приводит к необходимости разработки более устойчивых и мощных систем, которые могут легко переключаться между высокоуровневыми и низкоуровневыми задачами. Целью данной работы является разработка методологии, которая могла бы оптимизировать многоагентные системы, обеспечивая их эффективную координацию и устойчивость в различных сценариях. ## Метод SWIRL (Staged Workflow for Interleaved Reinforcement Learning) представляет собой инновационный подход к обучению многоагентных систем. Он преобразует задачи многоагентного обучения в последовательность задач обучения одного агента. В этой модели каждый агент обучается по очереди, при этом другие агенты остаются неизменными. Этот подход обеспечивает стабильность обучения и позволяет достичь эффективного взаимодействия между агентами. Для гарантии качества и корректности решений в SWIRL внедрены такие теоретические примитивы, как шаг защиты обучения, теорема о монотонном улучшении и гарантии на возврат при оптимизации. Метод также включает в себя Navigator, который преобразует естественный язык и контекст экрана в структурированные планы, и Interactor, который реализует эти планы на уровне атомарных действий. ## Результаты SWIRL протестирован на широком спектре задач, включая обработку естественного языка и контроль низкоуровневых элементов GUI. Обширные эксперименты показали, что SWIRL превосходит существующие методы в выполнении задач, обеспечивая более высокую точность и устойчивость в решении задач. В частности, на мобильных GUI бенчмарках SWIRL демонстрирует улучшение производительности, уменьшая количество ошибок и увеличивая скорость выполнения задач. Этот подход также продемонстрировал свою эффективность в задачах многоагентного математического разумания, подтверждая широкий потенциал SWIRL как основы для развития многоагентных систем. ## Значимость Помимо мобильных GUI-систем, SWIRL может быть применен в таких областях, как управление роботами, системы автоматизированного обучения и обработка изображений. Особенностью SWIRL является его гибкость и мощь, позволяющие применять его в различных контекстах. Этот подход обеспечивает эффективность, стабильность и гарантированные результаты в различных зада

Annotation:

The rapid advancement of large vision language models (LVLMs) and agent systems has heightened interest in mobile GUI agents that can reliably translate natural language into interface operations. Existing single-agent approaches, however, remain limited by structural constraints. Although multi-agent systems naturally decouple different competencies, recent progress in multi-agent reinforcement learning (MARL) has often been hindered by inefficiency and remains incompatible with current LVLM ar...

ID: 2508.20018v1 cs.AI, cs.CL, cs.CV, cs.MA

arXiv PDF

1
2
105
106
107
108
109
129
130

Показано 1061 - 1070 из 1292 записей