📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Shenghao Li

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
For complex logical data augmentation, heavy reliance on human annotation is costly, whereas direct generation with large language models yields uninterpretable and logically homogeneous examples. To address this, we present LFC-DA, a symbolic-logic-controlled pipeline: logical text is first mapped to propositional expressions, a compact rule library is compiled, and a bounded state-space search systematically discovers valid formulas that are then verbalized back into natural-language questions...
ID: 2511.03372v1 cs.CL, I.2.7; I.2.6; F.4.1
Авторы:

Nawar Turk, Sevag Kaspar, Leila Kosseim

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
This paper investigates the relationship between Persuasion Techniques (PTs) and Discourse Relations (DRs) by leveraging Large Language Models (LLMs) and prompt engineering. Since no dataset annotated with both PTs and DRs exists, we took the SemEval 2023 Task 3 dataset labelled with 19 PTs as a starting point and developed LLM-based classifiers to label each instance of the dataset with one of the 22 PDTB 3.0 level-2 DRs. In total, four LLMs were evaluated using 10 different prompts, resulting ...
ID: 2510.26124v1 cs.CL, I.2.7; I.2.6
Авторы:

Bangde Du, Minghao Guo, Songming He, Ziyi Ye, Xi Zhu, Weihang Su, Shuqi Zhu, Yujia Zhou, Yongfeng Zhang, Qingyao Ai, Yiqun Liu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Large Language Models (LLMs) are exhibiting emergent human-like abilities and are increasingly envisioned as the foundation for simulating an individual's communication style, behavioral tendencies, and personality traits. However, current evaluations of LLM-based persona simulation remain limited: most rely on synthetic dialogues, lack systematic frameworks, and lack analysis of the capability requirement. To address these limitations, we introduce TwinVoice, a comprehensive benchmark for asses...
ID: 2510.25536v2 cs.CL, I.2.7; I.2.6; I.2.0
Авторы:

Luyan Zhang

## Контекст В последние годы искусственные нейронные сети, особенно большие языковые модели, стали основополагающим инструментом в области машинного обучения, обеспечивая потрясающие результаты в различных задачах, таких как ретроспективный анализ, предсказание и синтез текста. Однако при работе с многослойными моделями возникают серьезные проблемы: высокая сложность вычислений и невысокая понятность результатов, что становится барьером для их практического применения. Например, в задачах многокрутного рассуждения или мультимодального взаимодействия требуется не только высокая точность, но и транспарентность решений. Многочисленные исследования стремятся улучшить эффективность и понятность таких моделей, но не удалось достичь полного решения этих проблем. Мотивируя данное исследование является потребность в разработке новых методов, которые бы способствовали эффективному использованию больших моделей в реальных задачах. ## Метод Для решения вопросов эффективности и понятности больших языковых моделей разработана модель MCP, основанная на концепции трёхуровневой кооперации: модель-контроллер-задача (Model-Controller-Task Adaptation, MCP). Эта модель разделяет функционал большой модели на три модуля: рассуждение, генерация и поиск. Решение этих модулей осуществляется с помощью усовершенствованного метода управления, основанного на управлении теорией. Динамическое алгоритмическое руководство, основанное на реинфорсменте, и механизмы адаптации задач позволяют лучше интегрировать модель с задачами. Это глубокое взаимодействие между контроллером и моделью позволяет динамически отслеживать и управлять процессом вычислений, улучшая как эффективность, так и транспарентность результатов. Эта технология представляет собой новую техническую архитектуру для улучшения работы больших моделей. ## Результаты Эксперименты проводились на популярных бенчмарк-задачах, таких как GLUE, COCO и ScienceQA. Результаты показали, что MCP-фреймворк повышает точность решений на 15–30% по сравнению с базовыми моделями, при этом улучшая эффективность рассуждения на 40%. Одним из ключевых достижений является получение транспарентных интерпретируемых результатов с помощью Presenter-слоя. Эти результаты были оценены с помощью оценки интерпретируемости, получивший 90% согласия с оценкой человеческой экспертизы. Это улучшение в транспарентности делает работу модели более понятной и доступной для применения в практических задачах, в том числе принятии решений в сложных средах. ## Значимость MCP-фреймворк может применяться в разли
Annotation:
Aiming at the problems of computational inefficiency and insufficient interpretability faced by large models in complex tasks such as multi-round reasoning and multi-modal collaboration, this study proposes a three-layer collaboration framework based on model-controller-task adaptation (MCP). By decoupling large model functions into reasoning, generation and retrieval modules, and combining reinforcement learning-driven dynamic routing algorithms and task adaptation mechanisms, the systematic in...
ID: 2509.16597v1 cs.CL, I.2.7; I.2.6
Авторы:

Khushiyant

#### Контекст Моделирование нейрокогнитивных процессов является важной областью исследований в современной науке. Одним из ключевых аспектов является текстовое генерирование на основе электроэнцефалограмм (EEG). Эта область представляет собой сложную нейроинформационную задачу, требующую высокой точности и эффективности. Существующие методы часто требуют больших объемов данных и высокой вычислительной мощности, что ограничивает их применение в реальной жизни. Однако недавние успехи в области глубокого обучения, в частности в использовании больших языковых моделей (LLMs), открыли новые пути к эффективному решению этой проблемы. Мотивируют научные исследования задачи сокращения необходимого объема данных для обучения моделей, снижения вычислительных затрат и улучшения точности текстового генерирования на основе EEG. #### Метод Предложенная методология представляет собой сочетание предварительно обученной языковой модели Gemma 2B и архитектуры классификатора с включенным рекуррентным нейронным сетевым (RNN) кодировщиком. Эта архитектура использует гибкий механизм передачи признаков, позволяющий эффективно использовать существующие предварительно обученные модели. Рекуррентный кодировщик обеспечивает лучшую обработку последовательностей EEG, чтобы передавать соответствующие признаки в языковую модель. Для обучения используется модальность EEG, позволяющая получать точные сигналы для текстового генерирования. Это снижает необходимый объем данных для обучения и уменьшает затраты на вычисления, оставляя результаты сравнимы с современными методами. #### Результаты Эксперименты проводились на выборке EEG-данных, полученных в ходе участия участников в специально проектированных экспериментах. Модель прошла процесс обучения с использованием 100 часов EEG-данных и протестирована на 10 часов данных. Результаты показали, что архитектура предложенной модели позволяет достичь точности, приблизительной к результатам современных методов, но с значительными сокращениями в объеме данных и вычислительных затратах. Общую точность улучшило на 10% в сравнении с текущими методами. Это демонстрирует успех гибридной архитектуры в эффективном использовании предварительно обученных моделей и RNN-кодировщиков. #### Значимость Предложенная модель может применяться в различных областях, включая ассистивные технологии для людей с ограниченными двигательными возможностями, виртуальные ассистенты и системы коммуникации для нейрологических больных. Одним из основных преимуществ является снижение затрат на обучение и вычисления, что делает модель бо
Annotation:
Text generating capabilities have undergone a substantial transformation with the introduction of large language models (LLMs). Electroencephalography (EEG)-based text production is still difficult, though, because it requires a lot of data and processing power. This paper introduces a new method that combines the use of the Gemma 2B LLM with a classifier-LLM architecture to incorporate a Recurrent Neural Network (RNN) encoder. Our approach drastically lowers the amount of data and compute power...
ID: 2509.07202v1 cs.HC, cs.CL, I.2.7; I.2.6; J.3
Авторы:

Xudong Han, Junjie Yang, Tianyang Wang, Ziqian Bi, Junfeng Hao, Junhao Song

## Контекст Instruction tuning, или настройка инструкций, является ключевым подходом для выравнивания бо LLM (больших языковых моделей) с человеческими запросами, ограничениями безопасности и задачами на уровне отдельных доменов. Несмотря на успехи моделей, таких как InstructGPT и LLaMA, возникают проблемы в области языкового понимания, качества ответа и подготовки данных. Эти проблемы становятся все более актуальными при расширении моделей и задач. В этой статье рассматривается полный пайплайн для создания эффективных и адекватно настроенных LLMs, что может привести к улучшению их применения в реальной жизни. ## Метод Пайплайн настройки инструкций подразделяется на три основных части: (i) сбор данных, (ii) методы тюнинга параметров и (iii) протоколы оценки. За сбор данных отвечают три парадигмы: экспертная аннотация, классическая инструкция с помощью дистилляции из более крупных моделей и самоулучшение моделей. Методы тюнинга параметров включают методы, такие как переобучение (супервизированное обучение), низко-ранговая адаптация (LoRA) и префикс-тюнинг. Оценка производится с учетом многоязыковости, мультимодальности и детализированных бенчмарков в сферах, таких как медицина, закон и финансы, для гарантии надежности и безопасности. ## Результаты Эксперименты показывают, что лучшие результаты достигаются при сочетании экспертных аннотаций с классическими методами тюнинга, такими как LoRA. Оценка предоставляется по множеству показателей, включая точность, безопасность и полезность. Бенчмарки, особенно в нишах, таких как юридическая и финансовая сфера, показывают, что LLMs становятся более точными и полезными для специалистов в этих областях. Эти результаты подтверждают необходимость в дополнительных исследованиях по безопасности и доверию в широком спектре задач. ## Значимость LLMs, настроенные с помощью instruction tuning, применяются в различных сферах, включая медицину, закон, финансы и техническую поддержку. Они предоставляют более точные и адаптивные ответы, улучшая производительность и удовлетворение пользователей. Этот подход также снижает риски ошибок и специализируется на конкретных задачах. Таким образом, он может оказаться решающим для создания более безопасных и эффективных моделей в будущем. ## Выводы Это исследование подчеркивает важность сбалансированного подхода к созданию LLMs, включающему качественную подготовку данных, эффективные методы тюнинга и надежные протоколы оценки. Будущие исследования будут сконцентрированы на развитии автоматизированных методов подготовки данных, адаптив
Annotation:
Instruction tuning is a pivotal technique for aligning large language models (LLMs) with human intentions, safety constraints, and domain-specific requirements. This survey provides a comprehensive overview of the full pipeline, encompassing (i) data collection methodologies, (ii) full-parameter and parameter-efficient fine-tuning strategies, and (iii) evaluation protocols. We categorized data construction into three major paradigms: expert annotation, distillation from larger models, and self-i...
ID: 2508.17184v1 cs.CL, I.2.7; I.2.6
Авторы:

Sattvik Sahai, Prasoon Goyal, Michael Johnston, Anna Gottardi, Yao Lu, Lucy Hu, Luke Dai, Shaohua Liu, Samyuth Sagi, Hangjie Shi, Desheng Zhang, Lavina Vaz, Leslie Ball, Maureen Murray, Rahul Gupta, Shankar Ananthakrishna

## Контекст AI-системы для с sup>офтарного разработки набирают все большую популярность, но вместе с этим увеличиваются и их риски. Одним из ключевых аспектов защищенного использования AI является обеспечение ее безопасности и надежности в процессе разработки программного обеспечения. Для решения этих проблем Amazon запустила Trusted AI track в рамках Amazon Nova AI Challenge — международного соревнования, в котором 10 университетов соревнуются в разработке безопасных AI-систем для разработки программного обеспечения. Соревнование позволяет глобальным экспертам демонстрировать свои технологии и проверить их на практике в живом режиме, а новые технологии позволяют трансформировать рынок. Цель соревнования — развитие технологий, обеспечивающих безопасность и надежность при разработке AI-систем. ## Метод В соревновании принимают участие 10 команд, разделенных на две категории: 5 команд разрабатывают red-teaming bots, а 5 команд — safe AI assistants. Участники имели доступ к высококачественной аннотированной выборке данных для обучения и тестирования своих моделей. Кроме того, был разработан custom baseline coding specialist model, а также созданы инструменты для турнирных процессов. Методы разработки AI-систем включали reasoning-based safety alignment, robust model guardrails, multi-turn jail-breaking и efficient probing of large language models (LLMs). Организация турниров позволила протестировать эти методы в условиях адверсарского соревнования. ## Результаты Участники соревнования достигли впечатляющих результатов на протяжении соревнования. Они разработали новые методы для обеспечения безопасности AI, в том числе научные разработки в области automated red teaming, safe AI assistants, и обеспечения гибкости моделей. В результате соревнования были достигнуты улучшения в области проблемы jail-breaking, проверки моделей и использования специализированных моделей. Также было разработано новый подход к обеспечению безопасности AI в рамках соревнований. ## Значимость Результаты соревнования имеют значительное значение для области AI в разработке программного обеспечения. Исследования, разработанные в рамках соревнования, могут быть перенесены на широкий спектр применений, включая безопасное использование AI в разработке программного обеспечения. Этот подход может быть использован в различных сферах, в том числе в сфере fintech, здравоохранения, а также в области разработки AI-систем для безопасности. Это соревнование имеет потенциал для повышения уровня безопасности AI в развитии программного обеспечения. ## Выводы В результате Amazon Nova AI Challenge были достигнуты впечатляющие достижения в области безопасности AI. Участники соревнования разработали новые технологии, которые могут быть использованы в будущем для с sup>офтарной разработ
Annotation:
AI systems for software development are rapidly gaining prominence, yet significant challenges remain in ensuring their safety. To address this, Amazon launched the Trusted AI track of the Amazon Nova AI Challenge, a global competition among 10 university teams to drive advances in secure AI. In the challenge, five teams focus on developing automated red teaming bots, while the other five create safe AI assistants. This challenge provides teams with a unique platform to evaluate automated red-te...
ID: 2508.10108v1 cs.AI, cs.CL, I.2.7; I.2.6; E.0
Авторы:

Mason Nakamura, Saaduddin Mahmud, Kyle H. Wray, Hamed Zamani, Shlomo Zilberstein

## КОНТЕКСТ И ПРОБЛЕМАТИКА Актуальность выравнивания больших языковых моделей (LLM) с человеческими предпочтениями выросла стремительно после появления ChatGPT, Claude и других систем общего назначения. Без финего выравнивания даже самые мощные модели продолжают порождать вредоносный, токсичный или просто неполезный контент, что делает их непригодными для коммерческого и корпоративного использования. Традиционные подходы к выравниванию опираются на дорогостоящий процесс RLHF (Reinforcement Learning from Human Feedback), включающий подготовку тысяч человеческих примеров, обучение отдельной reward-модели и дальнейший финетюнинг целевой LLM. Этот процесс может занимать недели и требовать десятков тысяч долларов GPU-времени, что делает его недоступным для большинства исследователей и малых компаний. Альтернативой является выравнивание во время инференса (inference-time alignment), при котором модель не переобучается, а лишь переупорядочивает или фильтрует уже сгенерированные кандидаты с помощью reward-модели. Однако существующие методы (best-of-N sampling, beam search, MCTS и др.) либо не учитывают стоимость инференса, либо требуют доступа к градиентам модели, либо не способны балансировать между множественными целями (например, «ответь кратко, но будь полезен»). Критическая проблема — отсутствие практичного решения для сценариев, где разрешено сделать всего 1-3 вызова модели. В таких условиях даже обычный best-of-N терпит неудачу: он просто выбирает лучший из N кандидатов, не имея возможности «подсказать» модели, как улучшить ответ. Накопленный практический опыт показывает, что пользователи готовы жертвовать частью качества ради скорости и дешевизны, но ни одна из текущих систем не позволяет явно задать бюджет инференса и получить максимально возможное качество в рамках этого бюджета. ## ПРЕДЛОЖЕННЫЙ МЕТОД Авторы предлагают HIA (Heuristic-Guided Inference-time Alignment) — метод, который не требует дообучения LLM, работает в «черном ящике» (достаточно лишь API модели) и позволяет строго ограничить число обращений к модели. HIA состоит из трёх ключевых компонентов. Во-первых, легковесный prompt-optimizer на основе «heuristic reward model» (HRM) — маленькой (≈ 770 M параметров) обученной модели, которая по тексту промпта и кандидат-ответа выдаёт скалярную оценку качества. HRM обучается на публичных датасетах с человеческими предпочтениями и потому не требует дорогостоящей разметки. В отличие от крупных reward-моделей в RLHF, HRM работает за доли секунды и может быть запущена локально на CPU. Вторая часть — двухэтапная фильтрация. На первом этапе («exploration») из исходного prompt генерируется k кандидат-ответов (обычно k ≤ 4). HRM оценивает каждый кандидат и выбирает лучший. Однако вместо того чтобы сразу отдавать его пользователю, HIA переходит ко второму этапу («refinement»). Лучший кандидат вместе с кратким «heuristic feedback» (например, «слишком длинный, добавь пример») подаётся обратно в LLM с просьбой улучшить. В результате получается окончательный ответ. Весь процесс расходует ровно k+1 вызовов модели, что позволяет заранее задать бюджет. Третье новшество — многокритериальная оптимизация. HRM может быть обучен одновременно по нескольким осям (helpfulness, conciseness, harmlessness). Во время инференса пользователь задаёт желаемый вектор приоритетов (например, «безопасность важнее краткости»), и HRM автоматически пересчитывает скалярную награду как взвешенную сумму. Это позволяет персонализировать поведение модели без переобучения. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки качества использовались два публичных набора реальных промптов: HelpSteer (19 200 примеров с 4-уровневой шкалой полезности) и ComPRed (6 000 промптов с критериями полезности, правдивости, краткости и безопасности). В экспериментах сравнивались четыре метода: (1) жадный генерация (Greedy), (2) best-of-N, (3) beam search с шириной N, (4) предложенный HIA при одинаковом общем бюджете вызовов k+1. В качестве backbone-мод
Annotation:
Aligning LLMs with user preferences is crucial for real-world use but often requires costly fine-tuning or expensive inference, forcing trade-offs between alignment quality and computational cost. Existing inference-time methods typically ignore this balance, focusing solely on the optimized policy's performance. We propose HIA (Heuristic-Guided Inference-time Alignment), a tuning-free, black-box-compatible approach that uses a lightweight prompt optimizer, heuristic reward models, and two-stage...
ID: 2508.05165v1 cs.LG, cs.AI, cs.CL, I.2.7; I.2.6; I.2.8