End-to-End Text-to-SQL with Dataset Selection: Leveraging LLMs for Adaptive Query Generation
2508.06387v2
cs.LG, cs.AI
2025-08-12
Авторы:
Anurag Tripathi, Vaibhav Patle, Abhinav Jain, Ayush Pundir, Sairam Menon, Ajeet Kumar Singh, Dorien Herremans
Резюме на русском
#### Контекст
Изучение текст-к-SQL-конвертации — это ключевая область исследований в интеллектуальных системах. Она способствует переводу запросов в человеческом языке на SQL-команды, позволяя неквалифицированным пользователям эффективно использовать базы данных. Однако существующие решения строго связаны с определенной базой данных, что ограничивает их применение в контекстах с несколькими базами. Это может привести к погрешности в выборе исходной базы, что сказывается на точности генерируемого запроса. Мотивация для этого исследования заключается в развитии универсального подхода, который мог бы определить целевую базу данных и генерировать точные SQL-запросы.
#### Метод
Предложенный подход представляет собой многостадийную архитектуру с тремя основными этапами: выделение правил, определение базы данных и рефинирование запроса. На первом этапе используется трансформер-модель, настроенная с помощью промпто-инжиниринга, для извлечения правил из естественного языка запроса. На втором этапе, enkbert-размерной модели машинного обучения, обученной на больших данных, применяется для предсказания базы данных, соответствующей заданному запросу. На третьем этапе создаются критические агенты, которые выявляют и исправляют ошибки в генерируемом запросе. Это интегрированное решение обеспечивает адаптивность и точность в процессе генерации SQL-запросов.
#### Результаты
Результаты экспериментов проводились на стандартных тестовых наборах данных, включающих несколько баз данных. Модель демонстрирует высокую точность в определении целевой базы данных и генерации SQL-кода. Сравнение с состоянием искусства показывает, что метод превосходит другие подходы по обоим показателям. Эта модель также эффективна в обработке запросов с недостаточной вероятностью ошибки, что демонстрирует ее широкую применимость в сценариях с множеством баз данных.
#### Значимость
Предложенный подход имеет высокую значимость в нескольких областях. Он может использоваться в системах поддержки принятия решений, анализе данных и управлении базами данных, позволяя неквалифицированным пользователям работать с базами данных без технических знаний. Одним из основных преимуществ является универсальность, позволяющая применять модель к любой базе данных без предварительного определения. Это может существенно упростить процессы данных в различных областях, таких как финансы, здравоохранение и управление проектами.
#### Выводы
Предложенная модель демонстрирует высокую эффективность в текст-к-SQL-конвертации, особенно в сценариях с несколькими базами данных.
Abstract
Text-to-SQL bridges the gap between natural language and structured database
language, thus allowing non-technical users to easily query databases.
Traditional approaches model text-to-SQL as a direct translation task, where a
given Natural Language Query (NLQ) is mapped to an SQL command. Recent advances
in large language models (LLMs) have significantly improved translation
accuracy, however, these methods all require that the target database is
pre-specified. This becomes problematic in scenarios with multiple extensive
databases, where identifying the correct database becomes a crucial yet
overlooked step. In this paper, we propose a three-stage end-to-end text-to-SQL
framework to identify the user's intended database before generating SQL
queries. Our approach leverages LLMs and prompt engineering to extract implicit
information from natural language queries (NLQs) in the form of a ruleset. We
then train a large db\_id prediction model, which includes a RoBERTa-based
finetuned encoder, to predict the correct Database identifier (db\_id) based on
both the NLQ and the LLM-generated rules. Finally, we refine the generated SQL
by using critic agents to correct errors. Experimental results demonstrate that
our framework outperforms the current state-of-the-art models in both database
intent prediction and SQL generation accuracy.
Ссылки и действия
Дополнительные ресурсы: