Analysis of Error Sources in LLM-based Hypothesis Search for Few-Shot Rule Induction

2509.01016v1 cs.AI, cs.CL, cs.LG, cs.NE 2025-09-05

Авторы:

Aishni Parab, Hongjing Lu, Ying Nian Wu, Sumit Gulwani

Резюме на русском

## Контекст Индуктивное обучение является ключевым аспектом человеческого мозга, позволяющим выводить абстрактные правила из ограниченных примеров и применять их к новым ситуациям. Однако существуют сложности в понимании, как машинное обучение может эффективно реализовать индуктивное обучение. В данном исследовании авторы сравнивают подходы гипотезы поиска с подходом прямого генерирования программ на основе машинного обучения, основанного на больших лингвистических моделях (LLM), для решения задач малоподкрепленного вывода правил. Эта проблема важна, поскольку поиск гипотез может стать мощным инструментом для моделирования индуктивного разума, но пока недостаточно изучен. ## Метод Методология исследования основывается на сравнении двух подходов: гипотезы поиска и прямого генерирования программ. Гипотеза поиска подразумевает, что большая лингвистическая модель создает список возможных гипотез, а затем их оценивают на основе тестирующих примеров. Прямое генерирование программ, напротив, прямо генерирует программу, которая решает задачу. Исследование использовало данные из существующих выборок для оценки качества вывода. Архитектура системы предполагает использование LLM для представления и поиска гипотез, а также для оценки их точности. ## Результаты В ходе экспериментов, проведенных на различных сетках данных, гипотезный поиск показал себя очень эффективно, приближаясь к решениям, достигаемым человеком, с почти одинаковой точностью. Однако прямое генерирование программ оказалось значительно менее эффективным, тем более что при поиске гипотез была достигнута высокая стабильность и низкая стоимость ошибок. Это демонстрирует, что поиск гипотез является более эффективным методом для решения задач малоподкрепленного вывода правил. ## Значимость Результаты исследования имеют значительное значение для многих областей, включая робототехнику, автоматизацию и научную исследовательскую деятельность. Гипотезный поиск может быть применен для моделирования индуктивного разума в системах, которые должны работать с ограниченными данными. Особым преимуществом является его высокая точность и устойчивость к ошибкам, что делает его привлекательным в ситуациях, где важно минимизировать ошибки. Этот подход может стать мощным инструментом для ускорения развития ИИ в области индуктивного обучения. ## Выводы Авторы заключают, что гипотезный поиск является эффективным подходом для решения задач малоподкрепленного вывода правил и может стать ключевым инструментом для моделирования индуктивного разума. Однако остаются нерешенными про

Abstract

Inductive reasoning enables humans to infer abstract rules from limited examples and apply them to novel situations. In this work, we compare an LLM-based hypothesis search framework with direct program generation approaches on few-shot rule induction tasks. Our findings show that hypothesis search achieves performance comparable to humans, while direct program generation falls notably behind. An error analysis reveals key bottlenecks in hypothesis generation and suggests directions for advancing program induction methods. Overall, this paper underscores the potential of LLM-based hypothesis search for modeling inductive reasoning and the challenges in building more efficient systems.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Резюме на русском

Abstract

Ссылки и действия

Навигация