Kernel-based Equalized Odds: A Quantification of Accuracy-Fairness Trade-off in Fair Representation Learning

2508.15084v1 stat.ML, cs.LG 2025-08-23
Авторы:

Yijin Ni, Xiaoming Huo

Резюме на русском

## Контекст Одной из самых актуальных проблем в области машинного обучения является достижение справедливости и устранение дискриминации в алгоритмах. Особое внимание уделяется ситуациям, когда модели предсказывают результаты в зависимости от смещенных данных, что приводит к существенным ошибкам в сферах, таких как рекрутинг, кредитные отказы и даже медицинские диагностики. Одним из ключевых понятий в этой области является **Equalized Odds (EO)**, которое предлагает сбалансировать справедливость в отношении различных групп, определяемых чувствительным атрибутом (например, пол или раса), с балансом точности предсказаний. Несмотря на свою полезность, EO-критерий часто остается недостаточно интерпретируемым и сложен в оценке. Наша мотивация заключается в построении более прозрачного и интерпретируемого критерия, который может декомпозировать EO на более осмысленные элементы, а также обеспечить более строгую оценку точности-справедливости взаимозависимости. ## Метод Мы предлагаем **Kernel-based Equalized Odds (EOkEO_k)** — новую формулировку критерия EO, основанную на идеях гиперплоскостей в пространствах РКИ. Наш подход предлагает интерпретируемую декомпозицию EO на три основных объективных показателя: **взаимная независимость** (независимость результата от чувствительного атрибута), **разделение** (равенство вероятности ошибки в зависимости от результата) и **калибровка** (справедливость в предсказаниях). Мы рассматриваем две ситуации: **безусловное распределение**, когда $Y$ не зависит от $S$, и **смещенное распределение**, когда $Y$ зависит от $S$. Для реализации мы предлагаем **empirical EO_k\hat{EO}_k**, вычисляемый в квадратичном времени с линейной аппроксимацией. Для оценки поведения метода мы используем устойчивые оценки с помощью концентрационных неравенств. ## Результаты Мы проводим эксперименты на синтетичных и реальных данных, включая данные по возрасту и полу в задаче кредитного отказа. Наши результаты показывают, что критерий $EO_k$ позволяет тщательно декомпозировать EO, предоставляя более точные оценки для каждого компонента. Мы также показываем, что $EO_k$ успешно определяет точность-справедливость взаимозависимость в сложных ситуациях, когда целевая переменная зависит от чувствительного атрибута. Кроме того, наши результаты показывают, что $\hat{EO}_k$ обеспечивает высокую точность и дает оценки, которые могут быть легко интерпретированы в контексте потребностей реальных задач. ## Значимость Наши результаты имеют значительное значение в области **Fair Representation Learning (FRL)**, где требуется совмести

Abstract

This paper introduces a novel kernel-based formulation of the Equalized Odds (EO) criterion, denoted as $EO_k$, for fair representation learning (FRL) in supervised settings. The central goal of FRL is to mitigate discrimination regarding a sensitive attribute $S$ while preserving prediction accuracy for the target variable $Y$. Our proposed criterion enables a rigorous and interpretable quantification of three core fairness objectives: independence (prediction $\hat{Y}$ is independent of $S$), separation (also known as equalized odds; prediction $\hat{Y}$ is independent with $S$ conditioned on target attribute $Y$), and calibration ($Y$ is independent of $S$ conditioned on the prediction $\hat{Y}$). Under both unbiased ($Y$ is independent of $S$) and biased ($Y$ depends on $S$) conditions, we show that $EO_k$ satisfies both independence and separation in the former, and uniquely preserves predictive accuracy while lower bounding independence and calibration in the latter, thereby offering a unified analytical characterization of the tradeoffs among these fairness criteria. We further define the empirical counterpart, $\hat{EO}_k$, a kernel-based statistic that can be computed in quadratic time, with linear-time approximations also available. A concentration inequality for $\hat{EO}_k$ is derived, providing performance guarantees and error bounds, which serve as practical certificates of fairness compliance. While our focus is on theoretical development, the results lay essential groundwork for principled and provably fair algorithmic design in future empirical studies.

Ссылки и действия