PENGUIN: Enhancing Transformer with Periodic-Nested Group Attention for Long-term Time Series Forecasting
2508.13773v1
cs.LG, cs.AI
2025-08-21
Авторы:
Tian Sun, Yuqi Chen, Weiwei Sun
Резюме на русском
#### Контекст
Long-term time series forecasting (LTSF) является ключевым заданием в области анализа данных, которое находит применение в многих сферах, включая экономику, финансы, энергетику и транспорт. Несмотря на то, что Transformer-based модели достигли успеха в многих задачах, их эффективность в LTSF остается спорной. Это связано с проблемами, такими как неэффективное масштабирование при работе с длинными последовательностями и недостаточная учета периодических характеристик во входных данных. Для решения этих проблем необходимо разработать модели, которые могут одновременно обрабатывать длинные последовательности и эффективно учитывать периодические структуры.
#### Метод
Мы предлагаем Periodic-Nested Group Attention (PENGUIN), который состоит из двух ключевых компонентов: periodic-nested relative attention bias и grouped attention mechanism. Эти механизмы позволяют модели PENGUIN эффективно моделировать периодичности, независимо от их вида (например, дневные или недельные циклы). Periodic-nested relative attention bias используется для прямого учета периодических структур, тогда как grouped attention mechanism позволяет одновременно учитывать несколько периодичностей. Модель также включает multi-query attention, которая повышает ее эффективность и точность.
#### Результаты
Мы проводили эксперименты на нескольких LTSF-benchmarks, включая Electricity, Traffic и Exchange-Rate. Результаты показали, что PENGUIN превосходит оба MLP-based и Transformer-based методы. Она показывает лучшую точность в предсказании при максимальном доступном контексте в 2048 точек. Эксперименты также подтвердили, что PENGUIN выдает более точные результаты при обработке данных с несколькими периодичностями.
#### Значимость
PENGUIN может быть применена в различных областях, где требуется точное предсказание данных временных рядов, таких как энергетическая промышленность, транспорт, финансы и логистика. Ее основные преимущества заключаются в высокой точности, эффективности обработки данных с множеством периодичностей и удобстве в использовании. Эта модель может стать предпочтительным выбором для LTSF и положить основу для будущих исследований в этой области.
#### Выводы
Предложенная модель PENGUIN доказала свою эффективность в LTSF, показав значительные выигрыши по сравнению с конкурирующими методами. Мы планируем продолжать развивать эту модель, направляясь на улучшение ее масштабируемости и учета дополнительных контекстных факторов. Это позволит PENGUIN стать еще более мощным инструментом для решения LTSF задач в различных практических приложениях.
Abstract
Long-term time series forecasting (LTSF) is a fundamental task with
wide-ranging applications. Although Transformer-based models have made
significant breakthroughs in forecasting, their effectiveness for time series
forecasting remains debatable. In this paper, we revisit the significance of
self-attention and propose a simple yet effective mechanism, Periodic-Nested
Group Attention, namely PENGUIN. Our approach highlights the importance of
explicitly modeling periodic patterns and incorporating relative attention bias
for effective time series modeling. To this end, we introduce a periodic-nested
relative attention bias that captures periodic structures directly. To handle
multiple coexisting periodicities (e.g., daily and weekly cycles), we design a
grouped attention mechanism, where each group targets a specific periodicity
using a multi-query attention mechanism. Extensive experiments across diverse
benchmarks demonstrate that PENGUIN consistently outperforms both MLP-based and
Transformer-based models.
Ссылки и действия
Дополнительные ресурсы: