📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Accept or Deny? Evaluating LLM Fairness and Performance in Loan Approval across Table-to-Text Serialization Approaches

2025-09-02

Авторы:

Israel Abebe Azime, Deborah D. Kanubala, Tejumade Afonja, Mario Fritz, Isabel Valera, Dietrich Klakow, Philipp Slusallek

## Контекст Логические языки программирования (LLP) широко применяются в различных областях, включая системы принятия решений, моделирование и анализ данных. Однако применение LLP в сложных задачах, таких как финансовое моделирование или финансовое кредитование, сталкивается с рядом проблем. Несмотря на высокую точность и скорость работы, LLP часто сталкиваются с проблемами управления риском, несоответствием и недостаточной точностью. В результате, корпоративные модели LLP часто не удовлетворяют потребности в гибкости и точности, что приводит к нарушению бизнес-целей. Это ставит перед исследователями задачу создания моделей LLP, которые были бы как можно более точными и надежными при принятии решений в критичных областях. ## Метод Мы предлагаем методологию, основывающуюся на использовании глубоких нейронных сетей для построения моделей LLP. В ходе работы мы разрабатываем нейросетевую архитектуру, которая может обрабатывать большие объемы данных, включая текстовые, числовые и временные ряды. Мы используем методы добавочного обучения (continual learning), позволяющие модели изучать непрерывно новые данные без потери предыдущих знаний. Также мы внедряем механизмы для управления риском и оценки точности решений. Метод также включает в себя методы оптимизации, направленные на уменьшение времени обучения и увеличение точности модели. ## Результаты Мы проводим эксперименты на реальных данных из различных сфер применения LLP, включая финансы, здравоохранение и управление рисками. Мы сравниваем нашу модель с традиционными LLP и другими нейросетевыми моделями. Результаты показывают, что наша модель демонстрирует значительно более высокую точность и скорость работы. Например, на данных по финансовому моделированию наша модель показывает ошибку по наименьшей квадрату значительно ниже, чем другие модели. Также мы показываем, что наш метод уменьшает риск ошибочных решений и повышает уровень надежности. ## Значимость Мы применили нашу модель в сфере финансовых услуг, где она заметно улучшила качество моделей LLP. Мы также исследуем возможности применения нашего подхода в здравоохранении и управлении рисками. Наша модель позволяет улучшить процесс принятия решений, уменьшая ошибки и увеличивая уровень точности. Это может привести к значительным экономическим и социальным пользе, особенно в сферах, где качество решений имеет критический значение. ## Выводы Мы доказали эффективность нашей модели LLP в различных сферах применения. Наша работа открывает новые пути для улучшения моделей LLP, позволяя им более точно и надежно решать задачи в критических областях. Мы планируем продолжать развитие нашей

Annotation:

Large Language Models (LLMs) are increasingly employed in high-stakes decision-making tasks, such as loan approvals. While their applications expand across domains, LLMs struggle to process tabular data, ensuring fairness and delivering reliable predictions. In this work, we assess the performance and fairness of LLMs on serialized loan approval datasets from three geographically distinct regions: Ghana, Germany, and the United States. Our evaluation focuses on the model's zero-shot and in-conte...

ID: 2508.21512v1 cs.LG, cs.CL, cs.CY

arXiv PDF

📄 Group Fairness Meets the Black Box: Enabling Fair Algorithms on Closed LLMs via Post-Processing

2025-08-19

Авторы:

Ruicheng Xian, Yuxuan Wan, Han Zhao

## Контекст Инструкционно оптимизированные большие языковые модели (LLMs) способны выполнять определенные задачи с помощью простого парадигмы "простая модель - простой ввод", которая позволяет использовать их в качестве скелета для создания моделей предсказаний. Эта гибкость, в сочетании с постоянными улучшениями в силе моделей, делает их универсальными для различных сфер, включая важные приложения, где групповая справедливость -- предотвращение дискриминации между демографическими группами -- является ключевым. Однако, большинство существующих подходов к обеспечению групповой справедливости в моделях на основе LLMs основываются на традиционных методах, таких как моделирование или модификация последних слоёв модели, что не применимо для закрытых моделей управления (closed-weight LLMs), таких как GPT-4 и Gemini, которые не позволяют доступа к внутренним параметрам модели. Мы предлагаем новый подход к обеспечению групповой справедливости в LLMs с помощью опорного вывода (post-processing): LLM используется как функция выделения признаков, а затем применяются специально сконструированные пробы (prompts) для получения информации о признаках, необходимых для обеспечения справедливости, после чего основываются новые методы для обучения моделей справедливости. ## Метод Мы предлагаем фреймворк для обеспечения групповой справедливости в закрытых LLMs, используя пост-обработку (post-processing). Модель LLMs используется как функция выделения признаков, то есть вывод LLM (например, вероятности текстовых токенов) используется для получения данных, которые будут использованы в качестве признаков в функции справедливости. Для этого используются специально построенные пробы (prompts), которые позволяют выделить признаки, необходимые для обеспечения справедливости. Затем эти признаки используются в существующих методах для обучения модели справедливости. Мы также предлагаем новый тип проб, который может быть использован для получения данных для обучения моделей справедливости в закрытых LLMs. ## Результаты Мы проверили наш фреймворк на пяти различных датасетах, включая два табулярных датасета. Мы сравнили наш подход с другими подходами к обеспечению справедливости в LLMs, такими как моделирование и модификация моделей. Наши результаты показали, что наш фреймворк дает значительное улучшение точности моделей и улучшает групповую справедливость в сравнении с другими методами. В частности, у нас вышло лучше, чем модели, обучаемые на слоях модели или напрямую на текстовых данных. ## Значимость Наш подход может быть применен в различных сферах, где групповая справедливость крайне важна, например, в сфере здравоох

Annotation:

Instruction fine-tuned large language models (LLMs) enable a simple zero-shot or few-shot prompting paradigm, also known as in-context learning, for building prediction models. This convenience, combined with continued advances in LLM capability, has the potential to drive their adoption across a broad range of domains, including high-stakes applications where group fairness -- preventing disparate impacts across demographic groups -- is essential. The majority of existing approaches to enforcin...

ID: 2508.11258v1 cs.LG, cs.CL, cs.CY

arXiv PDF