Gradient Interference-Aware Graph Coloring for Multitask Learning

2509.16959v1 cs.LG, cs.AI, cs.NE, stat.ML 2025-09-24
Авторы:

Santosh Patapati, Trisanth Srinivasan

Резюме на русском

## Контекст В многозадачном обучении (multi-task learning) существуют ситуации, когда цели разных задач противоречат друг другу, что приводит к взаимому мешанию градиентов (gradient interference). Такое взаимодействие замедляет сходимость и ухудшает последствия обучения. Несмотря на значительные улучшения в многозадачном обучении, эффективные методы управления такими конфликтами остаются неисследоваными. Это приводит к предложению новых подходов, которые могут улучшить обучение, устранив проблему градиентного мешания. ## Метод Задача раскрашивания графа (graph coloring) представляет поток градиентов в виде взвешенного графа. Затем, метод использует жадный алгоритм раскраски графа, чтобы разделить задачи на группы, где градиенты будут совместимы. Этот алгоритм работает в реальном времени, пересчитывая раскраску при изменении взаимосвязей задач. В ходе обучения задачи в пределах одной группы (цвета) будут обновляться совместимо, чтобы не помешать друг другу. Это позволяет увеличить эффективность оптимизатора многозадачного обучения без дополнительных настроек. ## Результаты Результаты получены на шести разных датасетах, показавшими, что новый подход постоянно превосходит современные оптимизаторы многозадачного обучения. Эксперименты подтвердили, что использование раскраски графа с учетом интерференции градиентов способствует более стабильному и эффективному обучению. Обнаружено, что метод позволяет повысить точность и уменьшить число итераций обучения. ## Значимость Метод может применяться в любых ситуациях многозадачного обучения, где существуют конфликты между задачами. Он привносит выгоду в процессе обучения, уменьшая конфликт градиентов и повышая эффективность. Это делает его полезным для различных приложений, в том числе в области здравоохранения, автоматизации и машинного обучения. ## Выводы Предложенный метод показал свою эффективность в решении конфликтов градиентов в многозадачном обучении. Он открывает путь к дальнейшим исследованиям в области улучшения методов обучения с несколькими задачами, которые могут значительно улучшить результаты в задачах, где задачи конфликтуют. Будущие исследования могут сосредоточиться на улучшении алгоритмов раскраски графа и их применении в различных контекстах.

Abstract

When different objectives conflict with each other in multi-task learning, gradients begin to interfere and slow convergence, thereby reducing the final model's performance. To address this, we introduce a scheduler that computes gradient interference, constructs an interference graph, and then applies greedy graph-coloring to partition tasks into groups that align well with each other. At each training step, only one group (color class) of tasks are activated. The grouping partition is constantly recomputed as task relationships evolve throughout training. By ensuring that each mini-batch contains only tasks that pull the model in the same direction, our method improves the effectiveness of any underlying multi-task learning optimizer without additional tuning. Since tasks within these groups will update in compatible directions, model performance will be improved rather than impeded. Empirical results on six different datasets show that this interference-aware graph-coloring approach consistently outperforms baselines and state-of-the-art multi-task optimizers.

Ссылки и действия

Связанные статьи

Hierarchical Self-Attention: Generalizing Neural Attention Mechanics to Multi-Sc...

## Контекст В последние годы трансформеры и их механизм внимания стали одной из фундаментальных составляющих искусственн...

2025-09-23