TransLLM: A Unified Multi-Task Foundation Framework for Urban Transportation via Learnable Prompting

2508.14782v1 cs.CL, cs.AI 2025-08-22

Авторы:

Jiaming Leng, Yunying Bi, Chuan Qin, Bing Yin, Yanyong Zhang, Chao Wang

Резюме на русском

## Контекст Urban transportation systems сталкиваются с разнообразными проблемами, такими как прогнозирование трафика, предсказание спроса на зарядку электрических автомобилей (EV) и управление такси. На сегодняшний день, существующие подходы страдают от двух главных ограничений: малые модели глубокого обучения специфичны для конкретных задач и требуют больших объемов данных, что ограничивает их универсальность. Другая сторона медали — большие модели языка (LLMs), которые, несмотря на свою гибкость и способность обрабатывать естественный язык, сталкиваются с трудностями при работе с структурированными пространственно-временными данными и численным рассуждением. Для решения этих проблем предлагается новый подход, в рамках которого используется TransLLM — креативный фреймворк, который объединяет способности глубокого обучения и LLMs, способствуя эффективному решению таких задач. ## Метод TransLLM предлагает инновационный подход к решению задач, связанных с городским транспортом. Основным элементом фреймворка является лёгкая модель пространственно-временного моделирования, которая использует дилацированные свертки времени и двухуровневые сети внимания на основе графа смежности. Эта модель эффективно моделирует зависимости времени и пространства. Для улучшения гибкости и контекстной точности, TransLLM внедряет механизм под названием "Instance-Level Prompt Routing", который использует учёт ситуаций для динамического построения специализированных спротонизированных запросов. Эти спротонизированные запросы помогают LLMs более эффективно рассуждать над задачами. Фреймворк также включает проектирование задач в контекст специализированных выходных слоев, которые улучшают точность прогнозирования. Этот подход гармонично объединяет мощь LLMs и специфичные задачи, обеспечивая универсальный подход для решения проблем городского транспорта. ## Результаты Проведенные эксперименты охватывают семь датасетов и три задачи: прогнозирование трафика, предсказание спроса на зарядку EV и таксопарковки. Модель TransLLM демонстрирует выдающиеся результаты, даже в случае нулевого признака, когда модель не имеет предварительного обучения на конкретной задаче. Результаты были сравнены с десятью основными базовыми моделями, и TransLLM показала себя как мощная альтернатива с значительным преимуществом в ситуациях, когда необходимо гибко решать задачи с большой многообразием. Она показала свою гибкость, эффективность и способность к обучению с подкреплением, чтобы персонифицировать свой подход в зависимости от конкретных задач. ## Значимость TransLLM может бы

Abstract

Urban transportation systems encounter diverse challenges across multiple tasks, such as traffic forecasting, electric vehicle (EV) charging demand prediction, and taxi dispatch. Existing approaches suffer from two key limitations: small-scale deep learning models are task-specific and data-hungry, limiting their generalizability across diverse scenarios, while large language models (LLMs), despite offering flexibility through natural language interfaces, struggle with structured spatiotemporal data and numerical reasoning in transportation domains. To address these limitations, we propose TransLLM, a unified foundation framework that integrates spatiotemporal modeling with large language models through learnable prompt composition. Our approach features a lightweight spatiotemporal encoder that captures complex dependencies via dilated temporal convolutions and dual-adjacency graph attention networks, seamlessly interfacing with LLMs through structured embeddings. A novel instance-level prompt routing mechanism, trained via reinforcement learning, dynamically personalizes prompts based on input characteristics, moving beyond fixed task-specific templates. The framework operates by encoding spatiotemporal patterns into contextual representations, dynamically composing personalized prompts to guide LLM reasoning, and projecting the resulting representations through specialized output layers to generate task-specific predictions. Experiments across seven datasets and three tasks demonstrate the exceptional effectiveness of TransLLM in both supervised and zero-shot settings. Compared to ten baseline models, it delivers competitive performance on both regression and planning problems, showing strong generalization and cross-task adaptability. Our code is available at https://github.com/BiYunying/TransLLM.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

TransLLM: A Unified Multi-Task Foundation Framework for Urban Transportation via Learnable Prompting

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

UW-BioNLP at ChemoTimelines 2025: Thinking, Fine-Tuning, and Dictionary-Enhanced...

AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees

SignRoundV2: Closing the Performance Gap in Extremely Low-Bit Post-Training Quan...

Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Sou...

SEAL: Self-Evolving Agentic Learning for Conversational Question Answering over ...

Навигация