Soft Gradient Boosting with Learnable Feature Transforms for Sequential Regression

2509.12920v1 cs.LG, eess.SP 2025-09-18
Авторы:

Huseyin Karaca, Suleyman Serdar Kozat

Резюме на русском

#### Контекст Последовательная регрессия — одна из наиболее важных задач в машинном обучении, накладывающая высокие требования к точности и эффективности алгоритмов. Особенно вызовы становятся острыми в ситуациях с высокой размерностью данных и недостаточным количеством выборок. Одной из ключевых проблем в таких задачах является необходимость выявить наиболее важные признаки и привести их к форме, оптимальной для обучения. Наличие существующих методов, таких как супервизированное обучение и автокодиры, позволяют решать эти проблемы, но часто лишь в ограниченных областях. Мы предлагаем Soft Gradient Boosting with Learnable Feature Transforms, чтобы улучшить эффективность и точность решения подобных задач. #### Метод Мы предлагаем расширение фреймворка супервизированного обучения, включая в процесс обучения линейную трансформацию признаков. На каждом этапе построения дерева решений мы используем не только линейную модель, но и оптимизируем трансформацию входных признаков. Это позволяет улучшить качество решения, особенно в ситуациях с высокой размерностью признаков. Мы используем метод градиентного подъема, чтобы обучить модель, используя сигналы ошибок из предыдущих итераций. Эта процедура позволяет улучшить решение, учитывая взаимодействия между признаками и повышая точность модели. #### Результаты Мы проводили эксперименты на синтетических и реальных данных, сравнивая нашу модель с традиционными подходами. Наши результаты показали, что Soft Gradient Boosting with Learnable Feature Transforms эффективно уменьшает ошибку регрессии и повышает точность модели, особенно в случаях с небольшим количеством данных и высокой размерностью признаков. Мы также проверили расширенную версию, включающую нелинейные трансформации. Это позволило исследовать модель в более сложных сценариях, где она также показала высокую эффективность. #### Значимость Предлагаемый подход может быть применен в различных областях, где необходимо обнаруживать важные признаки и их трансформации для улучшения результатов регрессионной задачи. Например, в сферах биологии, финансов и моделирования трафика она может помочь улучшить прогнозирование и решать задачи моделирования взаимосвязей. Одним из основных преимуществ является возможность эффективного обучения в ситуациях с ограниченным количеством данных, а также регуляризация модели, что помогает избежать переобучения. #### Выводы Мы представили продвинутый подход к последовательной регрессии, который объединяет обучение с учителем и линейную трансформацию признаков. Результаты экспериментов показали, что наш подход эффективно решает задачи регрессии в сложных с

Abstract

We propose a soft gradient boosting framework for sequential regression that embeds a learnable linear feature transform within the boosting procedure. At each boosting iteration, we train a soft decision tree and learn a linear input feature transform Q together. This approach is particularly advantageous in high-dimensional, data-scarce scenarios, as it discovers the most relevant input representations while boosting. We demonstrate, using both synthetic and real-world datasets, that our method effectively and efficiently increases the performance by an end-to-end optimization of feature selection/transform and boosting while avoiding overfitting. We also extend our algorithm to differentiable non-linear transforms if overfitting is not a problem. To support reproducibility and future work, we share our code publicly.

Ссылки и действия