## Контекст
Системы машинного обучения (ML), особенно те, что имеют критический прирост безопасности, такие как системы различения лиц, часто подвержены атакам, основанным на адверсарных примерах, включая реалистичные варианты внештатного использования. Несмотря на то, что существуют методы для усиления машинного обучения в отношении адверсарного нападения, они часто приводят к несправедливости в системе. То есть, атаки легче выполняться с определенных классов или групп, чем со стороны других. Это не только так, но в разных работах, где стремились к совершенному справедливому обращению с различными классами, показано, что достигнуть этого в реальных задачах, таких как распознавание лиц, часто невозможно. Поэтому, в нашей работе, мы основываемся на идее симметрии — то есть, атаки от класса $i$ к классу $j$ были бы такими же успешными, как и в обратном направлении. Мы считаем, что симметрия — это более достижимый подход, так как отношение схожести между классами является симметричным в большинстве случаев. Более того, мы доказываем, что симметрия между индивидами приводит к симметрии между любыми подгруппами, в отличие от других подходов к справедливости, где групповая справедливость часто недостижима.
## Метод
Мы предлагаем Sy-FAR (Symmetry-based Fair Adversarial Robustness) — новую методику для улучшения справедливости в том числе и в ситуациях, где необходимо улучшить адверсарную робастность. Метод Sy-FAR оптимизирует симметричность между классами в модели, чтобы сделать атаки менее разбирательными в отношении классов. Это достигается путем изменения функциональной формы во время обучения модели, чтобы симметричность между классами была сохранена. Мы также используем множество учитывающих классы методы для оценки эффективности нашего подхода. Наши эксперименты проводятся на пяти различных датасетах, при этом мы используем три различных модели, в том числе две различные атаки — целевые и нецелевые.
## Результаты
Исследования показали, что Sy-FAR значительно повышает справедливость в адверсарном нападении по сравнению с другими методами. Также, Sy-FAR позволяет снизить влияние угрозы, которая вызывается несправедливостью в адверсарных атаках, а также уменьшает вероятность того, что атака будет успешно выполнена на определенных классах, чем другие. Мы также обнаружили, что Sy-FAR не только улучшает справедливость в адверсарных атаках, но и уменьшает время обучения и улучшает консистентность результатов в различных экспериментах. Это делает Sy-FAR более эффективным и надежным в сравнении