Evaluating Retrieval-Augmented Generation Strategies for Large Language Models in Travel Mode Choice Prediction
2508.17527v1
cs.AI, cs.CY, cs.LG
2025-08-27
Авторы:
Yiming Xu, Junfeng Jiao
Резюме на русском
## Контекст
Предсказание способа путешествия (travel mode choice) является ключевым фактором для эффективного транспортного планирования. Однако существующие статистические и машинное обучение (machine learning) модели страдают от редуцированной гибкости, ограниченной контекстной рассуждением и недостаточной общностью. В этом исследовании рассматривается возможность использования Large Language Models (LLMs), которые предлагают более гибкую и контекст-знающую модель для предсказания способа путешествия. Дополнительно, введена методология Retrieval-Augmented Generation (RAG), которая позволяет лучше интегрировать эмпирические данные в процесс предсказания. Исследование также исследует различные стратегии RAG для оптимизации процесса работы LLMs.
## Метод
Моделирование предсказаний о способах путешествия осуществляется с помощью LLMs, в которые внедрена RAG. Для подачи набора данных в модель используется модульный фреймворк, который позволяет сравнивать различные стратегии RAG. Используются четыре стратегии RAG: базовая RAG, RAG с балансировкой набора данных, RAG с кросс-энкодером для ре-ранкинга и RAG с балансировкой набора данных и кросс-энкодером для ре-ранкинга. Эти стратегии тестируются на трех различных моделях LLMs: OpenAI GPT-4o, o4-mini и o3. Для экспериментов использованы данные из 2023 Puget Sound Regional Household Travel Survey.
## Результаты
Эксперименты показали, что внедрение RAG значительно повышает точность предсказаний для всех моделей LLM. Наиболее эффективной была комбинация GPT-4o с балансировкой набора данных и кросс-энкодером для ре-ранкинга, которая достигла точности 80.8%. LLMs показали значительное преимущество в общей общей гибкости и точности по сравнению с статистическими и традиционными моделями машинного обучения.
## Значимость
Исследование демонстрирует значимость внедрения RAG в LLMs для предсказания способа путешествия. Результаты могут применяться в транспортном планировании и логистике для эффективного решения задач моделирования поведения. Данная модель также улучшает общую гибкость и точность моделей, что делает её более универсальной и полезной в разных сценариях.
## Выводы
Результаты показывают, что RAG значительно повышает точность предсказаний в LLMs для моделирования способа путешествия. Однако существует необходимость продолжать исследования для оптимизации стратегий RAG и их интеграции с LLMs, чтобы добиться наибольшего эффекта в моделировании поведения. Будущие исследования должны также сосредоточиться на расширении применения этой модели в различных транспортных сценариях.
Abstract
Accurately predicting travel mode choice is essential for effective
transportation planning, yet traditional statistical and machine learning
models are constrained by rigid assumptions, limited contextual reasoning, and
reduced generalizability. This study explores the potential of Large Language
Models (LLMs) as a more flexible and context-aware approach to travel mode
choice prediction, enhanced by Retrieval-Augmented Generation (RAG) to ground
predictions in empirical data. We develop a modular framework for integrating
RAG into LLM-based travel mode choice prediction and evaluate four retrieval
strategies: basic RAG, RAG with balanced retrieval, RAG with a cross-encoder
for re-ranking, and RAG with balanced retrieval and cross-encoder for
re-ranking. These strategies are tested across three LLM architectures (OpenAI
GPT-4o, o4-mini, and o3) to examine the interaction between model reasoning
capabilities and retrieval methods. Using the 2023 Puget Sound Regional
Household Travel Survey data, we conduct a series of experiments to evaluate
model performance. The results demonstrate that RAG substantially enhances
predictive accuracy across a range of models. Notably, the GPT-4o model
combined with balanced retrieval and cross-encoder re-ranking achieves the
highest accuracy of 80.8%, exceeding that of conventional statistical and
machine learning baselines. Furthermore, LLM-based models exhibit superior
generalization abilities relative to these baselines. Findings highlight the
critical interplay between LLM reasoning capabilities and retrieval strategies,
demonstrating the importance of aligning retrieval strategies with model
capabilities to maximize the potential of LLM-based travel behavior modeling.
Ссылки и действия
Дополнительные ресурсы: