📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня
Авторы:

Mohammadreza Daviran, Brian Lin, Davood Rafiei

#### Контекст Текст-to-SQL системы предназначены для перевода запросов, написанных на естественном языке, в SQL-запросы для выполнения на базах данных. Однако существуют проблемы с адаптацией этих систем к новым базам данных с разными схемами. Допускаются ошибки в структуре и семантике запросов, что снижает удобство использования систем. `SQL-Exchange` — это инновационный подход, который предлагает новую модель для трансформации SQL-запросов между разными базами данных, сохраняя исходную структуру запросов и адаптируя их к новой схеме. Он исследует условия, при которых такие трансформации возможны и полезны, а также показывает, как эта технология может улучшить "in-context learning" для текст-to-SQL систем. #### Метод `SQL-Exchange` основывается на двух основных этапах: **стадию модификации** и **стадию адаптации**. В первой стадии идентифицируются и анализируются различия между исходной и целевой схемами, а затем исходный запрос адаптируется для соответствия новой схеме. Это достигается с помощью `schema mapping`, который сопоставляет элементы исходной схемы с элементами целевой схемы. Технический подход включает в себя графы схем, автоматическое сопоставление и корректировку структуры запросов. Таким образом, `SQL-Exchange` обеспечивает точное преобразование запросов, сохраняя семантику и функциональность. #### Результаты Исследователи провести эксперименты на множестве баз данных, схем, и запросов, чтобы проверить точность и эффективность `SQL-Exchange`. Данные в экспериментах включали различные типы запросов, сложные структуры схем, и разные базы данных. Результаты показали, что `SQL-Exchange` эффективно преобразует запросы, сохраняя их структуру и семантику. Он также показал, что использование трансформированных запросов в качестве вводных примеров для "in-context learning" улучшает производительность текст-to-SQL систем по сравнению с использованием запросов из исходной схемы. #### Значимость `SQL-Exchange` может применяться в различных областях, где необходимо переводить SQL-запросы между разными базами данных, таких как бизнес-аналитика, мобильные приложения, и системы управления базами данных. Он обеспечивает более точное и надежное преобразование запросов, снижая риск ошибок и улучшая пользовательское взаимодействие с системами текст-to-SQL. Этот подход также может ускорить развитие технологий, связанных с адаптацией баз данных и систем текстового поиска. #### Выводы `SQL-Exchange` достигает успешного преобразования SQL-запросов между разными схемами, сохраняя их семантику и структуру. Он показал свою эффективность в различных контекстах и может
Annotation:
We introduce SQL-Exchange, a framework for mapping SQL queries across different database schemas by preserving the source query structure while adapting domain-specific elements to align with the target schema. We investigate the conditions under which such mappings are feasible and beneficial, and examine their impact on enhancing the in-context learning performance of text-to-SQL systems as a downstream task. Our comprehensive evaluation across multiple model families and benchmark datasets--a...
ID: 2508.07087v1 cs.DB, cs.AI, cs.CL
Авторы:

Ugur Cetintemel, Shu Chen, Alexander W. Lee, Deepti Raghavan

--- title: КОНТЕКСТ И ПРОБЛЕМАТИКА --- ### message ## КОНТЕКСТ И ПРОБЛЕМАТИКА Современные конвейеры больших языковых моделей (LLM) становятся все более похожими на данные, управляемые системы. Они извлекают внешний контекст, компонуют промежуточные результаты, проверяют выводы и адаптируются в зависимости от отзывов, полученных во время выполнения. Однако ключевым элементом, руководящим этим процессом, является **промпт** (запрос или контекст, передаваемый модели), который часто остается хрупким и непрозрачным. Промпты часто представляют собой неструктурированные строки, которые не интегрированы с окружающим процессом выполнения. Это создает серьезные ограничения на возможности повторного использования, оптимизации и управления процессом в реальном времени. Проблема заключается в том, что традиционные подходы к управлению промптами не обеспечивают достаточной гибкости и контроля над их динамическим поведением. В результате разработчики сталкиваются с трудностями при модификации промптов в ответ на изменяющиеся условия выполнения, такие как низкая уверенность модели, высокая задержка или отсутствие необходимого контекста. Кроме того, отсутствие структурированного управления промптами затрудняет их версионирование, отладку и анализ. Предлагаемое решение должно решить эту проблему, превратив промпты в **структурированные, адаптивные и первоклассные компоненты** конвейера выполнения. Такой подход позволит динамически изменять промпты в зависимости от сигналов, полученных во время выполнения, а также обеспечит возможность их структурированного хранения и оптимизации. ## ПРЕДЛОЖЕННЫЙ МЕТОД Решение, предложенное в работе, называется **SPEAR** — язык и среда выполнения, предназначенные для заполнения пробела в управлении промптами. SPEAR делает промпты структурированными, адаптивными и первоклассными элементами модели выполнения. SPEAR вводит **алгебру промптов**, которая определяет правила построения и адаптации промптов в конвейере. Эта алгебра поддерживает различные режимы уточнения (ручной, помощью пользователя и автоматический), обеспечивая баланс между контролем разработчика и автоматизацией процесса. Ключевыми компонентами SPEAR являются: 1. **Динамическая адаптация промптов**: SPEAR позволяет модифицировать промпты в реальном времени в ответ на сигналы, такие как низкая уверенность модели, высокая задержка или отсутствие контекста. Это обеспечивает более гибкое и реактивное поведение конвейера. 2. **Структурированное управление промптами**: SPEAR организует фрагменты промптов в версионируемые представления (views), которые могут быть инспектированы и записаны в логи. Это облегчает отладку, версионирование и повторное использование промптов. 3. **Оптимизации на уровне промптов**: Используя структурированный подход, SPEAR позволяет применять оптимизации, такие как слияние операторов (operator fusion), кэширование префиксов и повторное использование представлений, что повышает эффективность конвейера. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Авторы провели эксперименты для оценки эффективности SPEAR в сравнении с традиционными статическими промптами и агентскими повторными попытками (agentic retries). Результаты показали, что динамическая адаптация промптов позволяет значительно повысить точность и эффективность конвейера. Кроме того, эксперименты показали положительное влияние оптимизаций, таких как слияние операторов и кэширование префиксов, на производительность системы. Результаты демонстрируют, что SPEAR не только повышает качество вывода моделей, но и позволяет оптимизировать время выполнения и ресурсы. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ SPEAR имеет широкое применение в областях, требующих высокого уровня адаптивности и контроля над промптами. Это может включать: - **Конвейеры обработки естественного языка**: Где необходима динамическая модификация запросов в зависимости от контекста. - **Автоматизированные системы**: Где критична оптимизация времени выполнения и ресурсов. - **Системы с открытым контекстом**: Где важна возможность интеграции внешних данных и их динамического использования. Преимущества SPEAR включают в себя повышенную эффективность, улучшенную отладку и повторное использование кода, что делает его привлекательным для разработчиков сложных систем на основе LLM. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ SPEAR предлагает передовой подход к управлению промптами, превращая их в структурированные и адаптивные компоненты конвейера выполнения. Это позволяет решить многие проблемы, связанные с традиционными неструктурированными промптами, такие как низкая повторяемость, сложность отладки и ограниченные возможности оптимизации. Будущие исследования могут фокусироваться на расширении SPEAR для поддержки более широкого спектра режимов адаптации и оптимизации, а также на интеграции с другими системами управления данными для создания еще более гибких и эффективных конвейеров.
Annotation:
Modern LLM pipelines increasingly resemble data-centric systems: they retrieve external context, compose intermediate outputs, validate results, and adapt based on runtime feedback. Yet, the central element guiding this process -- the prompt -- remains a brittle, opaque string, disconnected from the surrounding dataflow. This disconnect limits reuse, optimization, and runtime control. In this paper, we describe our vision and an initial design for SPEAR, a language and runtime that fills this ...
ID: 2508.05012v1 cs.DB, cs.AI, cs.CL
Показано 11 - 12 из 12 записей