📊 Статистика дайджестов

Всего дайджестов: 35039 Добавлено сегодня: 432

Последнее обновление: сегодня

📄 Top-H Decoding: Adapting the Creativity and Coherence with Bounded Entropy in Text Generation

2025-09-05

Авторы:

Erfan Baghaei Potraghloo, Seyedarmin Azizi, Souvik Kundu, Massoud Pedram

## Контекст В современных текстовых генерационных моделях, таких как Large Language Models (LLMs), широко используется техника обрезания выбора токенов для генерации текста. Она позволяет контролировать тон и стиль генерируемого текста, ограничивая сеть выбором токенов соответствующего доверия. Однако существуют проблемы, связанные с тем, чтобы добиться оптимального баланса между творчеством и логической согласованностью. Техники, такие как top-\$p\$-sampling (nucleus sampling) и min-\$p\$-sampling, сталкиваются с ограничениями, в том числе слишком узкой оптимизации токена с наивысшим доверием без учета профиля вероятностей в целом. В данной работе мы сосредоточиваемся на развитии нового подхода для эффективного управления этой динамикой. ## Метод Мы предлагаем **top-H decoding**, метод, который позволяет контролировать творческую и когнитивную субъективность в текстовой генерации, основываясь на теоретических аспектах взаимодействия этих свойств. Метод опирается на формализацию проблемы **entropy-constrained minimum divergence** (ECMD), которая, в свою очередь, эквивалентна **entropy-constrained mass maximization** (ECMM), являющейся NP-трудной задачей. Для ее решения мы предлагаем грубое, но эффективное решение, основанное на логике грибного алгоритма. Этот подход позволяет снизить разброс в выборе токенов, увеличивая среднюю вероятность выбранных значений, с тем свойством, что он остается независим от того, насколько высокой или низкой требуется творческая степень. ## Результаты Мы проверили **top-H decoding** на нескольких датасетах, включая benchmarks для творческого письма и для вопросов-ответов (question-answering). На датасете Creative Writing Benchmarks, наш метод показал результаты, превосходящие существующие технологии, включая min-\$p\$-sampling, на **25.63%** в творческих задачах. Одновременно, на вопросах-ответах, таких как GPQA, GSM8K и MT-Bench, наша модель поддерживала высокую точность, не теряя в логической согласованности, даже при высоких значениях творчества. Также, с помощью LLM-as-judge мы проверили, что top-H сохраняет логическую когнитивную согласованность даже при высоком уровне творчества, что отличает его от min-\$p\$-sampling. ## Значимость Выводы работы показывают, что **top-H decoding** открывает новые горизонты в области текстовой генерации, давая возможность улучшить творческий потенциал и сохранить логическую целостность в тексте одновременно. Метод может быть успешно интегрирован в современные текстовые генерационные системы, включая модели для креативного письма, машинного обучения, интеллектуальных агентов и даже в область генерации новостей. Э

Annotation:

Large language models (LLMs), despite their impressive performance across a wide range of tasks, often struggle to balance two competing objectives in open-ended text generation: fostering diversity and creativity while preserving logical coherence. Existing truncated sampling techniques, including temperature scaling, top-\$p\$ (nucleus) sampling, and min-\$p\$ sampling, aim to manage this trade-off. However, they exhibit limitations, particularly in the effective incorporation of the confidenc...

ID: 2509.02510v1 cs.CL, cs.AI, stat.ML

arXiv PDF

📄 BED-LLM: Intelligent Information Gathering with LLMs and Bayesian Experimental Design

2025-09-02

Авторы:

Deepro Choudhury, Sinead Williamson, Adam Goliński, Ning Miao, Freddie Bickford Smith, Michael Kirchhof, Yizhe Zhang, Tom Rainforth

## Контекст Исследование рассматривает область интеллектуального группирования информации с использованием значимых технологий глубокого обучения, в частности, Байесовского экспериментального дизайна (BED). Логический мотив заключается в улучшении способности Large Language Models (LLMs) адаптироваться к участию в многоключевых беседах, взаимодействовать с внешними источниками данных и эффективно собирать информацию. Недостаток существующих подходов в том, что традиционные технологии не включают в себя интерактивного взаимодействия с пользователем и не учитывают последовательный характер сбора информации. Задача исследования — разработать новую методологию, позволяющую LLMs адаптироваться к сложным задачам информационного поиска и повысить точность решения пользовательских задач. ## Метод В центре исследования стоит концепция BED-LLM (Bayesian Experimental Design with Large Language Models), которая основывается на последовательном выборе запросов или вопросов, которые максимизируют ожидаемый прирост информации (Expected Information Gain, EIG) о целевой задаче. Метод использует прогностическую модель Байеса, в которой LLM строит свое внутреннее представление о реальности и использует его для принятия решений. Решение использует несколько ключевых инноваций, включая более точный алгоритм для вычисления EIG, не зависящий исключительно на входные данные, а также стратегию построения запросов, ориентированную на решение конкретных пользовательских задач. ## Результаты Исследования проводились на многочисленных тестах, в том числе использовались игры "20 вопросов" и задачи бинарного классификационного анализа. На этих тестах BED-LLM показал прирост в производительности в сравнении с традиционным подходом, основанным на LLMs, и даже с другими методами адаптивного дизайна. Был проведен эксперимент, где BED-LLM адаптивно изучал предпочтения пользователя в реальном времени. Результаты показали, что подход эффективно уменьшает число запросов, необходимых для достижения точного решения, и обеспечивает лучшую пользовательскую заинтересованность. ## Значимость Разработанный подход имеет широкое применение в области принятия решений в сложных средах, бизнес-анализе, медицине, информационной безопасности и других областях, где необходимо адаптивное взаимодействие с пользователем. Основные преимущества — увеличение точности решений и эффективность в решении задач с нетривиальными условиями. Логическое влияние — это возможность значительного улучшения интеллектуальных систем, в том числе роботов-консультантов, интеллектуальных авторов и диагностических систем. ## Выводы Ре

Annotation:

We propose a general-purpose approach for improving the ability of Large Language Models (LLMs) to intelligently and adaptively gather information from a user or other external source using the framework of sequential Bayesian experimental design (BED). This enables LLMs to act as effective multi-turn conversational agents and interactively interface with external environments. Our approach, which we call BED-LLM (Bayesian Experimental Design with Large Language Models), is based on iteratively ...

ID: 2508.21184v1 cs.CL, cs.AI, stat.ML

arXiv PDF