'Rich Dad, Poor Lad': How do Large Language Models Contextualize Socioeconomic Factors in College Admission ?

2509.16400v1 cs.CL, cs.CY 2025-09-24

Авторы:

Huy Nghiem, Phuong-Anh Nguyen-Le, John Prindle, Rachel Rudinger, Hal Daumé III

Резюме на русском

#### Контекст Large Language Models (LLMs) применяются в высокорисковых сферах, включая принятие решений в образовательных институтах. Однако их поведение при принятии социально чувствительных решений, таких как контекстуализация социально-экономического статуса (SES) в процессе поступления в колледж, остается мало исследовано. Учитывая важность этой проблемы, исследование фокусируется на том, как LLMs оценивают социально-экономические факторы, а также на потенциальных преимуществах и рисках их применения в таких научных и практических областях. #### Метод Для исследования был разработан новый фреймворк Dual-Process Audit Framework (DPAF), основанный на моделях развития решений человека: System 1 (быстрое, интуитивное решение) и System 2 (медленное, размышляющее решение). Использовались данные 30 000 синтетических аудитов, построенных на реальных корреляциях в социально-экономических факторах. Отклики от 4 LLMs (Qwen 2, Mistral v0.3, Gemma 2, Llama 3.1) были получены с помощью 5 миллионов запросов в двух режимах: быстрого System 1 и медленного System 2. #### Результаты Опытные результаты показали, что LLMs предпочитают кандидатов с низким SES, даже при учете их академических результатов. Этот эффект усиливается при System 2, когда LLMs специально приводят SES в качестве компенсаторного аргумента. Эти результаты подтверждают, что LLMs могут оказаться как полезным, так и нестабильным инструментом при принятии решений в образовательных процессах. #### Значимость Предложенный DPAF позволяет проверить способность LLMs учитывать социально-экономические факторы в стратегии принятия решений. Это может применяться в образовательных институтах для улучшения прозрачности и справедливости, а также для разработки более честных алгоритмов в других областях. Результаты также показывают, что LLMs могут использоваться для просветления человеческих решений, однако их использование требует осторожности. #### Выводы На основе проведенных экспериментов были получены значительные выводы о поведении LLMs в контексте социально-экономических факторов. Полученные результаты могут помочь развитию новых моделей аудита для проверки LLM-based приложений. Будущие исследования будут уделять больше внимания развитию более глубоких моделей размышления и созданию более любознательных и прозрачных LLM-based решений.

Abstract

Large Language Models (LLMs) are increasingly involved in high-stakes domains, yet how they reason about socially sensitive decisions remains underexplored. We present a large-scale audit of LLMs' treatment of socioeconomic status (SES) in college admissions decisions using a novel dual-process framework inspired by cognitive science. Leveraging a synthetic dataset of 30,000 applicant profiles grounded in real-world correlations, we prompt 4 open-source LLMs (Qwen 2, Mistral v0.3, Gemma 2, Llama 3.1) under 2 modes: a fast, decision-only setup (System 1) and a slower, explanation-based setup (System 2). Results from 5 million prompts reveal that LLMs consistently favor low-SES applicants -- even when controlling for academic performance -- and that System 2 amplifies this tendency by explicitly invoking SES as compensatory justification, highlighting both their potential and volatility as decision-makers. We then propose DPAF, a dual-process audit framework to probe LLMs' reasoning behaviors in sensitive applications.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

'Rich Dad, Poor Lad': How do Large Language Models Contextualize Socioeconomic Factors in College Admission ?

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Identifying attributions of causality in political text

Sycophancy Claims about Language Models: The Missing Human-in-the-Loop

CAIRNS: Balancing Readability and Scientific Accuracy in Climate Adaptation Ques...

Gender Bias in Emotion Recognition by Large Language Models

Analysing Personal Attacks in U.S. Presidential Debates

Навигация