📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 SX-GeoTree: Self-eXplaining Geospatial Regression Tree Incorporating the Spatial Similarity of Feature Attributions

2025-11-27

Авторы:

Chaogui Kang, Lijian Luo, Qingfeng Guan, Yu Liu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Decision trees remain central for tabular prediction but struggle with (i) capturing spatial dependence and (ii) producing locally stable (robust) explanations. We present SX-GeoTree, a self-explaining geospatial regression tree that integrates three coupled objectives during recursive splitting: impurity reduction (MSE), spatial residual control (global Moran's I), and explanation robustness via modularity maximization on a consensus similarity network formed from (a) geographically weighted re...

ID: 2511.19845v1 cs.LG, cs.CY, stat.ML

arXiv PDF

📄 A Primer on Causal and Statistical Dataset Biases for Fair and Robust Image Analysis

2025-09-06

Авторы:

Charles Jones, Ben Glocker

## Контекст Машинное обучение (ML) широко распространено в современных технологиях, но часто столкнется с проблемами при переходе от синтетических данных к реальной среде. Эти проблемы, особенно в высокорисковых областях, таких как медицинская диагностика, могут привести к негативным последствиям. Особенно характерными для машинного обучения являются проблемы, связанные с несбалансированными или биазными данными, которые способствуют неточностям и несправедливостям в результатах. Изучение этих проблем необходимо для создания более справедливых и надежных моделей машинного обучения, в частности, для обработки изображений. ## Метод В статье предлагается анализ структурных причин, вызывающих неточности в ML для изображений. Особое внимание уделяется двум проблемам: "нет бесплатного обеда" (no fair lunch) и "групповая отделимость" (subgroup separability). Методология включает изучение существующих подходов к обучению справедливых представлений и выявление их ограничений. Архитектура исследования основывается на экспериментальных исследованиях, использовании различных данных и сравнении различных моделей. ## Результаты Эксперименты показали, что текущие методы обучения справедливых представлений не могут полностью устранить проблемы биазных данных. Например, в задаче распознавания лиц модели могут демонстрировать снижение точности в отношении определенных групп, таких как женщины или представители культурных меньшинств. Анализ данных показал, что некоторые факторы, такие как цвет кожи или пола, могут быть неявно использованы моделями для принятия решений, что приводит к несправедливостям. ## Значимость Результаты имеют большое значение для сферы медицины, безопасности и социальных сетей, где точность и справедливость решений критичны. Исследования помогают выявить и устранить тенденции к несправедливости в ML-моделях. Изученные проблемы открывают новые возможности для развития более устойчивых и справедливых методов обработки изображений. ## Выводы Исследование выделяет основные причины неточностей в ML для обработки изображений и показывает, что существующие подходы необходимо доработать. Будущие исследования должны фокусироваться на развитии более сильных методов обучения справедливых представлений, которые могут учитывать сложные структурные биазы в данных. Это будет позволить создавать модели, более надёжные и справедливые в высокорисковых областях, таких как медицина и социальные сети.

Annotation:

Machine learning methods often fail when deployed in the real world. Worse still, they fail in high-stakes situations and across socially sensitive lines. These issues have a chilling effect on the adoption of machine learning methods in settings such as medical diagnosis, where they are arguably best-placed to provide benefits if safely deployed. In this primer, we introduce the causal and statistical structures which induce failure in machine learning methods for image analysis. We highlight t...

ID: 2509.04295v1 cs.LG, cs.CY, stat.ML

arXiv PDF