Evaluating Retrieval-Augmented Generation Strategies for Large Language Models in Travel Mode Choice Prediction

2508.17527v1 cs.AI, cs.CY, cs.LG 2025-08-27
Авторы:

Yiming Xu, Junfeng Jiao

Резюме на русском

## Контекст Предсказание способа путешествия (travel mode choice) является ключевым фактором для эффективного транспортного планирования. Однако существующие статистические и машинное обучение (machine learning) модели страдают от редуцированной гибкости, ограниченной контекстной рассуждением и недостаточной общностью. В этом исследовании рассматривается возможность использования Large Language Models (LLMs), которые предлагают более гибкую и контекст-знающую модель для предсказания способа путешествия. Дополнительно, введена методология Retrieval-Augmented Generation (RAG), которая позволяет лучше интегрировать эмпирические данные в процесс предсказания. Исследование также исследует различные стратегии RAG для оптимизации процесса работы LLMs. ## Метод Моделирование предсказаний о способах путешествия осуществляется с помощью LLMs, в которые внедрена RAG. Для подачи набора данных в модель используется модульный фреймворк, который позволяет сравнивать различные стратегии RAG. Используются четыре стратегии RAG: базовая RAG, RAG с балансировкой набора данных, RAG с кросс-энкодером для ре-ранкинга и RAG с балансировкой набора данных и кросс-энкодером для ре-ранкинга. Эти стратегии тестируются на трех различных моделях LLMs: OpenAI GPT-4o, o4-mini и o3. Для экспериментов использованы данные из 2023 Puget Sound Regional Household Travel Survey. ## Результаты Эксперименты показали, что внедрение RAG значительно повышает точность предсказаний для всех моделей LLM. Наиболее эффективной была комбинация GPT-4o с балансировкой набора данных и кросс-энкодером для ре-ранкинга, которая достигла точности 80.8%. LLMs показали значительное преимущество в общей общей гибкости и точности по сравнению с статистическими и традиционными моделями машинного обучения. ## Значимость Исследование демонстрирует значимость внедрения RAG в LLMs для предсказания способа путешествия. Результаты могут применяться в транспортном планировании и логистике для эффективного решения задач моделирования поведения. Данная модель также улучшает общую гибкость и точность моделей, что делает её более универсальной и полезной в разных сценариях. ## Выводы Результаты показывают, что RAG значительно повышает точность предсказаний в LLMs для моделирования способа путешествия. Однако существует необходимость продолжать исследования для оптимизации стратегий RAG и их интеграции с LLMs, чтобы добиться наибольшего эффекта в моделировании поведения. Будущие исследования должны также сосредоточиться на расширении применения этой модели в различных транспортных сценариях.

Abstract

Accurately predicting travel mode choice is essential for effective transportation planning, yet traditional statistical and machine learning models are constrained by rigid assumptions, limited contextual reasoning, and reduced generalizability. This study explores the potential of Large Language Models (LLMs) as a more flexible and context-aware approach to travel mode choice prediction, enhanced by Retrieval-Augmented Generation (RAG) to ground predictions in empirical data. We develop a modular framework for integrating RAG into LLM-based travel mode choice prediction and evaluate four retrieval strategies: basic RAG, RAG with balanced retrieval, RAG with a cross-encoder for re-ranking, and RAG with balanced retrieval and cross-encoder for re-ranking. These strategies are tested across three LLM architectures (OpenAI GPT-4o, o4-mini, and o3) to examine the interaction between model reasoning capabilities and retrieval methods. Using the 2023 Puget Sound Regional Household Travel Survey data, we conduct a series of experiments to evaluate model performance. The results demonstrate that RAG substantially enhances predictive accuracy across a range of models. Notably, the GPT-4o model combined with balanced retrieval and cross-encoder re-ranking achieves the highest accuracy of 80.8%, exceeding that of conventional statistical and machine learning baselines. Furthermore, LLM-based models exhibit superior generalization abilities relative to these baselines. Findings highlight the critical interplay between LLM reasoning capabilities and retrieval strategies, demonstrating the importance of aligning retrieval strategies with model capabilities to maximize the potential of LLM-based travel behavior modeling.

Ссылки и действия

Связанные статьи

What Does Your Benchmark Really Measure? A Framework for Robust Inference of AI ...

## Контекст Оценка генерирующих моделей с помощью бенчмарков стала обычной практикой, и их результаты значительно влияют...

2025-09-26

A Hybrid Ai Framework For Strategic Patent Portfolio Pruning: Integrating Learni...

## Контекст В настоящее время, оценка патентов и их технологического потенциала часто является затруднительной задачей, ...

2025-09-05

Explainable AI for Predicting and Understanding Mathematics Achievement: A Cross...

#### Контекст Предсказание и понимание успеваемости в математике являются ключевыми аспектами развития эффективных учебн...

2025-08-27