Soft Gradient Boosting with Learnable Feature Transforms for Sequential Regression
2509.12920v1
cs.LG, eess.SP
2025-09-18
Авторы:
Huseyin Karaca, Suleyman Serdar Kozat
Резюме на русском
#### Контекст
Последовательная регрессия — одна из наиболее важных задач в машинном обучении, накладывающая высокие требования к точности и эффективности алгоритмов. Особенно вызовы становятся острыми в ситуациях с высокой размерностью данных и недостаточным количеством выборок. Одной из ключевых проблем в таких задачах является необходимость выявить наиболее важные признаки и привести их к форме, оптимальной для обучения. Наличие существующих методов, таких как супервизированное обучение и автокодиры, позволяют решать эти проблемы, но часто лишь в ограниченных областях. Мы предлагаем Soft Gradient Boosting with Learnable Feature Transforms, чтобы улучшить эффективность и точность решения подобных задач.
#### Метод
Мы предлагаем расширение фреймворка супервизированного обучения, включая в процесс обучения линейную трансформацию признаков. На каждом этапе построения дерева решений мы используем не только линейную модель, но и оптимизируем трансформацию входных признаков. Это позволяет улучшить качество решения, особенно в ситуациях с высокой размерностью признаков. Мы используем метод градиентного подъема, чтобы обучить модель, используя сигналы ошибок из предыдущих итераций. Эта процедура позволяет улучшить решение, учитывая взаимодействия между признаками и повышая точность модели.
#### Результаты
Мы проводили эксперименты на синтетических и реальных данных, сравнивая нашу модель с традиционными подходами. Наши результаты показали, что Soft Gradient Boosting with Learnable Feature Transforms эффективно уменьшает ошибку регрессии и повышает точность модели, особенно в случаях с небольшим количеством данных и высокой размерностью признаков. Мы также проверили расширенную версию, включающую нелинейные трансформации. Это позволило исследовать модель в более сложных сценариях, где она также показала высокую эффективность.
#### Значимость
Предлагаемый подход может быть применен в различных областях, где необходимо обнаруживать важные признаки и их трансформации для улучшения результатов регрессионной задачи. Например, в сферах биологии, финансов и моделирования трафика она может помочь улучшить прогнозирование и решать задачи моделирования взаимосвязей. Одним из основных преимуществ является возможность эффективного обучения в ситуациях с ограниченным количеством данных, а также регуляризация модели, что помогает избежать переобучения.
#### Выводы
Мы представили продвинутый подход к последовательной регрессии, который объединяет обучение с учителем и линейную трансформацию признаков. Результаты экспериментов показали, что наш подход эффективно решает задачи регрессии в сложных с
Abstract
We propose a soft gradient boosting framework for sequential regression that
embeds a learnable linear feature transform within the boosting procedure. At
each boosting iteration, we train a soft decision tree and learn a linear input
feature transform Q together. This approach is particularly advantageous in
high-dimensional, data-scarce scenarios, as it discovers the most relevant
input representations while boosting. We demonstrate, using both synthetic and
real-world datasets, that our method effectively and efficiently increases the
performance by an end-to-end optimization of feature selection/transform and
boosting while avoiding overfitting. We also extend our algorithm to
differentiable non-linear transforms if overfitting is not a problem. To
support reproducibility and future work, we share our code publicly.
Ссылки и действия
Дополнительные ресурсы: