Gradient Interference-Aware Graph Coloring for Multitask Learning
2509.16959v1
cs.LG, cs.AI, cs.NE, stat.ML
2025-09-24
Авторы:
Santosh Patapati, Trisanth Srinivasan
Резюме на русском
## Контекст
В многозадачном обучении (multi-task learning) существуют ситуации, когда цели разных задач противоречат друг другу, что приводит к взаимому мешанию градиентов (gradient interference). Такое взаимодействие замедляет сходимость и ухудшает последствия обучения. Несмотря на значительные улучшения в многозадачном обучении, эффективные методы управления такими конфликтами остаются неисследоваными. Это приводит к предложению новых подходов, которые могут улучшить обучение, устранив проблему градиентного мешания.
## Метод
Задача раскрашивания графа (graph coloring) представляет поток градиентов в виде взвешенного графа. Затем, метод использует жадный алгоритм раскраски графа, чтобы разделить задачи на группы, где градиенты будут совместимы. Этот алгоритм работает в реальном времени, пересчитывая раскраску при изменении взаимосвязей задач. В ходе обучения задачи в пределах одной группы (цвета) будут обновляться совместимо, чтобы не помешать друг другу. Это позволяет увеличить эффективность оптимизатора многозадачного обучения без дополнительных настроек.
## Результаты
Результаты получены на шести разных датасетах, показавшими, что новый подход постоянно превосходит современные оптимизаторы многозадачного обучения. Эксперименты подтвердили, что использование раскраски графа с учетом интерференции градиентов способствует более стабильному и эффективному обучению. Обнаружено, что метод позволяет повысить точность и уменьшить число итераций обучения.
## Значимость
Метод может применяться в любых ситуациях многозадачного обучения, где существуют конфликты между задачами. Он привносит выгоду в процессе обучения, уменьшая конфликт градиентов и повышая эффективность. Это делает его полезным для различных приложений, в том числе в области здравоохранения, автоматизации и машинного обучения.
## Выводы
Предложенный метод показал свою эффективность в решении конфликтов градиентов в многозадачном обучении. Он открывает путь к дальнейшим исследованиям в области улучшения методов обучения с несколькими задачами, которые могут значительно улучшить результаты в задачах, где задачи конфликтуют. Будущие исследования могут сосредоточиться на улучшении алгоритмов раскраски графа и их применении в различных контекстах.
Abstract
When different objectives conflict with each other in multi-task learning,
gradients begin to interfere and slow convergence, thereby reducing the final
model's performance. To address this, we introduce a scheduler that computes
gradient interference, constructs an interference graph, and then applies
greedy graph-coloring to partition tasks into groups that align well with each
other. At each training step, only one group (color class) of tasks are
activated. The grouping partition is constantly recomputed as task
relationships evolve throughout training. By ensuring that each mini-batch
contains only tasks that pull the model in the same direction, our method
improves the effectiveness of any underlying multi-task learning optimizer
without additional tuning. Since tasks within these groups will update in
compatible directions, model performance will be improved rather than impeded.
Empirical results on six different datasets show that this interference-aware
graph-coloring approach consistently outperforms baselines and state-of-the-art
multi-task optimizers.