Symmetry-Aware Transformer Training for Automated Planning

2508.07743v1 cs.AI, cs.LG 2025-08-13

Авторы:

Markus Fritzsche, Elliot Gestrin, Jendrik Seipp

Резюме на русском

## Контекст На данный момент, трансформеры доказали свою эффективность во многих областях, но их применение в автоматизированном планировании ограничивается. Одним из основных поводов этого являются симметрии в планировании, которые вызывают значительные сложности для обучения. Известный стейт-оф-арт трансформера для автоматизированного планирования, PlanGPT, сталкивается с трудностями при проектировании сложных задач. Это происходит из-за того, что задачи планирования могут быть представлены в различных вариантах, используя произвольные идентификаторы переменных, которые не несут смысла. Это приводит к экспоненциальному росту эквивалентных представлений, которые трансформеры с трудом обучаются. Мы предлагаем новую методологию, основанную на создании более симметричного обучения, чтобы улучшить чувствительность трансформеров к таким симметриям и устранить это ограничение. ## Метод Мы предлагаем симметрично-подвижную обучающую систему, которая использует современные методы сопоставительного обучения. Эта методология включает в себя архитектурные усовершенствования, позволяющие трансформеру более эффективно обрабатывать симметрии в задачах планирования. Мы применяем специальный контрастирующий целевой функционал, который позволяет трансформеру изучить и отличать задачи с разными симметричными представлениями. Также, мы внедряем дополнительные архитектурные элементы, такие как дополнительные слои и механизмы внимания, для улучшения обработки плановых задач. ## Результаты Мы проводили эксперименты на нескольких планировании задачах, включая задачи планирования путей и задачи планирования действий. Мы сравнивали наши результаты с PlanGPT и другими моделями. Наши эксперименты показали, что наши трансформеры с симметричным обучением показали значительное улучшение в скорости обучения и точности решения сложных задач. Мы также показали, что модели с нашим методом могут эффективно выделять и использовать симметрии в задачах планирования, что приводит к более точным и эффективным решениям. ## Значимость Наш метод может быть применен в различных сферах, включая авиацию, производство и робототехнику, где автоматизированное планирование является критически важной задачей. Это решение позволяет использовать трансформеры для задач, где предыдущие модели сталкивались с ограничениями. Благодаря симметричному обучению, наша модель эффективно решает проблемы симметрии и улучшает общую эффективность. Это может привести к повышению производительности и уменьшению времени обучения во многих приложениях. ## Выводы

Abstract

While transformers excel in many settings, their application in the field of automated planning is limited. Prior work like PlanGPT, a state-of-the-art decoder-only transformer, struggles with extrapolation from easy to hard planning problems. This in turn stems from problem symmetries: planning tasks can be represented with arbitrary variable names that carry no meaning beyond being identifiers. This causes a combinatorial explosion of equivalent representations that pure transformers cannot efficiently learn from. We propose a novel contrastive learning objective to make transformers symmetry-aware and thereby compensate for their lack of inductive bias. Combining this with architectural improvements, we show that transformers can be efficiently trained for either plan-generation or heuristic-prediction. Our results across multiple planning domains demonstrate that our symmetry-aware training effectively and efficiently addresses the limitations of PlanGPT.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Symmetry-Aware Transformer Training for Automated Planning

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Mathematical Framing for Different Agent Strategies

Sequential Enumeration in Large Language Models

Educational Cone Model in Embedding Vector Spaces

A Benchmark of Causal vs Correlation AI for Predictive Maintenance

fMRI2GES: Co-speech Gesture Reconstruction from fMRI Signal with Dual Brain Deco...

Навигация