End-to-End Text-to-SQL with Dataset Selection: Leveraging LLMs for Adaptive Query Generation

2508.06387v2 cs.LG, cs.AI 2025-08-12

Авторы:

Anurag Tripathi, Vaibhav Patle, Abhinav Jain, Ayush Pundir, Sairam Menon, Ajeet Kumar Singh, Dorien Herremans

Резюме на русском

#### Контекст Изучение текст-к-SQL-конвертации — это ключевая область исследований в интеллектуальных системах. Она способствует переводу запросов в человеческом языке на SQL-команды, позволяя неквалифицированным пользователям эффективно использовать базы данных. Однако существующие решения строго связаны с определенной базой данных, что ограничивает их применение в контекстах с несколькими базами. Это может привести к погрешности в выборе исходной базы, что сказывается на точности генерируемого запроса. Мотивация для этого исследования заключается в развитии универсального подхода, который мог бы определить целевую базу данных и генерировать точные SQL-запросы. #### Метод Предложенный подход представляет собой многостадийную архитектуру с тремя основными этапами: выделение правил, определение базы данных и рефинирование запроса. На первом этапе используется трансформер-модель, настроенная с помощью промпто-инжиниринга, для извлечения правил из естественного языка запроса. На втором этапе, enkbert-размерной модели машинного обучения, обученной на больших данных, применяется для предсказания базы данных, соответствующей заданному запросу. На третьем этапе создаются критические агенты, которые выявляют и исправляют ошибки в генерируемом запросе. Это интегрированное решение обеспечивает адаптивность и точность в процессе генерации SQL-запросов. #### Результаты Результаты экспериментов проводились на стандартных тестовых наборах данных, включающих несколько баз данных. Модель демонстрирует высокую точность в определении целевой базы данных и генерации SQL-кода. Сравнение с состоянием искусства показывает, что метод превосходит другие подходы по обоим показателям. Эта модель также эффективна в обработке запросов с недостаточной вероятностью ошибки, что демонстрирует ее широкую применимость в сценариях с множеством баз данных. #### Значимость Предложенный подход имеет высокую значимость в нескольких областях. Он может использоваться в системах поддержки принятия решений, анализе данных и управлении базами данных, позволяя неквалифицированным пользователям работать с базами данных без технических знаний. Одним из основных преимуществ является универсальность, позволяющая применять модель к любой базе данных без предварительного определения. Это может существенно упростить процессы данных в различных областях, таких как финансы, здравоохранение и управление проектами. #### Выводы Предложенная модель демонстрирует высокую эффективность в текст-к-SQL-конвертации, особенно в сценариях с несколькими базами данных.

Abstract

Text-to-SQL bridges the gap between natural language and structured database language, thus allowing non-technical users to easily query databases. Traditional approaches model text-to-SQL as a direct translation task, where a given Natural Language Query (NLQ) is mapped to an SQL command. Recent advances in large language models (LLMs) have significantly improved translation accuracy, however, these methods all require that the target database is pre-specified. This becomes problematic in scenarios with multiple extensive databases, where identifying the correct database becomes a crucial yet overlooked step. In this paper, we propose a three-stage end-to-end text-to-SQL framework to identify the user's intended database before generating SQL queries. Our approach leverages LLMs and prompt engineering to extract implicit information from natural language queries (NLQs) in the form of a ruleset. We then train a large db\_id prediction model, which includes a RoBERTa-based finetuned encoder, to predict the correct Database identifier (db\_id) based on both the NLQ and the LLM-generated rules. Finally, we refine the generated SQL by using critic agents to correct errors. Experimental results demonstrate that our framework outperforms the current state-of-the-art models in both database intent prediction and SQL generation accuracy.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

End-to-End Text-to-SQL with Dataset Selection: Leveraging LLMs for Adaptive Query Generation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Prototype-Based Semantic Consistency Alignment for Domain Adaptive Retrieval

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

TimesNet-Gen: Deep Learning-based Site Specific Strong Motion Generation

Realizable Abstractions: Near-Optimal Hierarchical Reinforcement Learning

BEP: A Binary Error Propagation Algorithm for Binary Neural Networks Training

Навигация