📚 Саммари научных статей из arXiv

Найдено 34 результатов по запросу 'cs.LG, cs.CY' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Transparent and Fair Profiling in Employment Services: Evidence from Switzerland

2025-09-17

Авторы:

Tim Räz

## Контекст Длительный безработицы (LTU) остается значительной проблемой для искателей работы и органов государственных служб по работодательству. Чтобы сузить пробелы в мотивации и квалификации, а также оптимизировать индивидуальные подходы, появились статистические инструменты профилирования. Однако некоторые из них, особенно те, которые основаны на непрозрачных машинным обучением, вызывают вопросы относительно их прозрачности и справедливости. Этот документ анализирует возможности замены таких моделей на более прозрачные, используя административные данные из Швейцарии. Он сравнивает традиционные статистические, прозрачные и "черные-ящик" модели, оценивая их прогностическую эффективность, транспарентность и справедливость. ## Метод Для исследования были использованы административные данные об искателях работы и их работодателях. Методология включала сравнение трех типов моделей: традиционных статистических, прозрачных и непрозрачных. Традиционные модели основывались на линейных регрессиях, таких как логистическая регрессия. "Черные-ящик" модели использовали глубокое обучение, особенно градиентный бустинг (XGBoost). Новые модели "объясняемый бустинг" (Explainable Boosting Machines, EBM) представляют собой свежий подход, который стремится объединить транспарентность и высокую прогностическую эффективность. Методы функционировали на основе техники семплирования, линейных моделей и штрафов за несправедливость. ## Результаты Результаты сравнения показали, что модель EBM почти равняется по прогностической эффективности лучшим "черным-ящиком" моделям, но обеспечивает гораздо большую транспарентность. Модель EBM может быть легко интерпретирована, что позволяет понять, как она приходит к определенным прогнозам. Эксперименты также показали, что модели могут быть улучшены с помощью техник, таких как уменьшение спарсиности модели, сглаживание признаков и устранение проблем справедливости. Такие улучшения приводят к незначительной потере в прогностической эффективности, но значительно повышают прозрачность и справедливость. ## Значимость Прозрачные инструменты профилирования могут быть применены в различных сферах, в том числе в трудоустройстве, банковском сервисе и здравоохранении. Изучение моделей EBM показывает, что они могут быть инструментом, который обеспечивает доверие и аккаунтабельность, не уменьшая прогностическую эффективность. Это делает их привлекательными для органов государственного управления, которым требуется большая прозрачность и ответственность в принятии решений. ## Выводы

Annotation:

Long-term unemployment (LTU) is a challenge for both jobseekers and public employment services. Statistical profiling tools are increasingly used to predict LTU risk. Some profiling tools are opaque, black-box machine learning models, which raise issues of transparency and fairness. This paper investigates whether interpretable models could serve as an alternative, using administrative data from Switzerland. Traditional statistical, interpretable, and black-box models are compared in terms of pr...

ID: 2509.11847v1 cs.LG, cs.CY

arXiv PDF

📄 Examining the Relationship between Scientific Publishing Activity and Hype-Driven Financial Bubbles: A Comparison of the Dot-Com and AI Eras

2025-09-17

Авторы:

Aksheytha Chelikavada, Casey C. Bennett

## Контекст Эта работа изучает связь между научной публикационной деятельностью и финансовыми буBлем, сравнивая два модернных периода быстрого технологического развития: эпоху "dot-com" (1994–2001) и эру искусственного интеллекта (2017–2024). Эпоха "dot-com" охарактеризована стремительным ростом Интернета и связанных с ним технологий, которые открыли новые возможности, но также привели к финансовой кризису. Аналогичным образом, эра искусственного интеллекта характеризуется развитием и применением искусственного интеллекта, которое вызывает надежды на будущее, но также вызывает осведомленность о рисках финансового риска. Мотивация этого исследования заключается в том, чтобы определить, можно ли использовать темпporal сети социальных сетей (Temporal SNAs) для прогнозирования финансовых буBлем, основываясь на публикационных данных научных работ. ## Метод Работа использует трехярусную модель: 1) выявление трендов в сети научных публикаций с помощью temporal SNAs; 2) анализ финансовой динамики с помощью авторегрессионных моделей с гетероскедастичностью и корреляцией (AR X/GARCH); 3) кросс-сравнение эпох с целью выявления сходств и различий в тенденциях. Для обработки данных использовались методы машинного обучения (LSTM, KNN). Данные включают публикации из ведущих научных журналов, цитирования и финансовые показатели. Метод моделирования архитектуры SNAs предполагает исследование цитируемости работ в зависимости от времени и тематики. ## Результаты Исследование показало, что шаблоны из эпохи "dot-com" не способны точно предсказать поведение рынка в эпохе искусственного интеллекта. Хотя temporal SNAs выявили изменения в поведении публикаций между двумя эпохами, некоторые исследователи из эры искусственного интеллекта проявили цитируемость, напоминающую шаблоны из эпохи "dot-com". Анализ финансовых данных с помощью AR X/GARCH не обнаружил очевидных признаков финансового кризиса в эпоху искусственного интеллекта, но выявил потенциальные факторы, могущие способствовать возникновению буBла. Эксперименты показали, что модели LSTM и KNN дают неточные прогнозы в отношении возможного финансового кризиса, что указывает на неоднозначность данных. ## Значимость Результаты имеют значимость для различных сфер. В первую очередь, они могут быть полезны для мониторинга финансовых рынков и прогнозирования рисков. Это также может быть применимо для тенденций в научной публикационной деятельности и развития технологий. Одним из преимуществ работы является возможность идентификации сигналов, которые могут означа

Annotation:

Financial bubbles often arrive without much warning, but create long-lasting economic effects. For example, during the dot-com bubble, innovative technologies created market disruptions through excitement for a promised bright future. Such technologies originated from research where scientists had developed them for years prior to their entry into the markets. That raises a question on the possibility of analyzing scientific publishing data (e.g. citation networks) leading up to a bubble for sig...

ID: 2509.11982v1 cs.LG, cs.CY

arXiv PDF

📄 Quantum-Enhanced Forecasting for Deep Reinforcement Learning in Algorithmic Trading

2025-09-15

Авторы:

Jun-Hao Chen, Yu-Chien Huang, Yun-Cheng Tsai, Samuel Yen-Chi Chen

## Контекст Финансовый рынок является одной из самых динамичных и непредсказуемых сфер, где конкуренция и риск доминируют. Одним из ключевых аспектов успешной торговли является точная прогнозирование тенденций рынка. Традиционные методы часто сталкиваются с ограничениями в скорости и точности прогноза. За последние годы наблюдается нарастание интереса к использованию искусственного интеллекта (ИИ), и в частности глубокого обучения (DL), в финансовых приложениях. Однако традиционные ИИ-модели часто сталкиваются с ограничениями в представлении данных и эффективности алгоритмов. Это побудило исследователей исследовать новые подходы, включая взаимодействие с квантовыми вычислениями. В нашей статье мы рассмотрим, как квантово-Inspired Neural Networks (QINN) могут улучшить прогностическую модель для глубокого здравствующего агента в алгоритмической торговле. ## Метод В нашей работе мы применяем метод Quantum Long Short-Term Memory (QLSTM) для короткосрочного прогнозирования трендов и Quantum Asynchronous Advantage Actor-Critic (QA3C) для реализации глубокого здравствующего агента. Алгоритм QA3C является усовершенствованием классического алгоритма A3C, внедряющим квантовые элементы для улучшения эффективности. QLSTM используется для анализа данных и определения короткосрочных трендов, тогда как QA3C нацелен на оптимизацию торговых действий с учетом риска и вознаграждения. Мы разработали собственную архитектуру, которая объединяет эти два подхода для максимальной эффективности. Мы проводили подробные эксперименты с использованием реальных данных финансовых рынков, подготовленных с 2000-01-01 по 2025-04-30, с разбивкой на 80%-20% (обучение и тестирование). ## Результаты Проведенные эксперименты показали, что наша модель достигла неплохих результатов в торговле валютными ETF. Для USD/TWD, стратегия, основанная на QLSTM и QA3C, показала возврат в 11.87% за 5 лет с максимальной выпуклостью 0.92%. Это превышает несколько нефондовых валютных ETF. Мы проанализировали структуру состояний (функции QLSTM и индикаторы), настроили функцию вознаграждения, связанную с тенденцией и управлением риском, а также рассмотрели методы многопоточного тренировочного процесса. Результаты показали, что использование квантовых техник позволяет достичь конкурентной стоимости при малых торговых позициях с требовательным контролем рисков. ## Значимость Наш подход имеет широкие применения в торговле, особенно в сфере алгоритмических стратегий. Он может улучшить точность прогноза и эффективность торгов, что влечет за собой повышение доход

Annotation:

The convergence of quantum-inspired neural networks and deep reinforcement learning offers a promising avenue for financial trading. We implemented a trading agent for USD/TWD by integrating Quantum Long Short-Term Memory (QLSTM) for short-term trend prediction with Quantum Asynchronous Advantage Actor-Critic (QA3C), a quantum-enhanced variant of the classical A3C. Trained on data from 2000-01-01 to 2025-04-30 (80\% training, 20\% testing), the long-only agent achieves 11.87\% return over around...

ID: 2509.09176v2 cs.LG, cs.CY

arXiv PDF

📄 Quantum Machine Learning, Quantitative Trading, Reinforcement Learning, Deep Learning

2025-09-13

Авторы:

Jun-Hao Chen, Yu-Chien Huang, Yun-Cheng Tsai, Samuel Yen-Chi Chen

## Контекст Область исследования, охватывающая Quantum Machine Learning (QML), Quantitative Trading и Reinforcement Learning (RL), становится все более востребованой в современных финансовых приложениях. Рынок валют (Forex) представляет сложную среду с множеством переменных и неопределенности, где требуется высокая точность в прогнозировании и принятии решений. Однако на сегодняшний день многие существующие модели, основанные на традиционных методах, сталкиваются с ограничениями в ситуациях, где необходима более высокая скорость и точность. QML, в свою очередь, предлагает уникальные возможности для улучшения этих моделей, особенно при их интеграции с RL, чтобы повысить качество торгового агента. Изучение такого подхода может способствовать развитию более эффективных алгоритмов для финансового рынка. ## Метод Для реализации торгового агента был выбран стратегический подход, основанный на QLSTM для короткосрочного прогнозирования трендов и QA3C для оптимизации торговых решений. Архитектура QLSTM включала в себя различные финансовые показатели и сигналы, которые были обработаны через квантово-инспирированные слои, предоставляя более точные короткосрочные прогнозы. QA3C, в свою очередь, был использован для торгового агента, реализуя подход Asynchronous Advantage Actor-Critic, усиленный квантовыми методами. Эта модель была обучена на 80% данных за период с 2000-01-01 до 2025-04-30, оставшая 20% для тестирования. Для обеспечения эффективности использовалась многопоточная обработка, которая позволила увеличить скорость обучения и уменьшить время работы модели. ## Результаты На тестовой выборке торговый агент, основанный на QLSTM и QA3C, показал возможность достичь 11.87% дохода за период в 5 лет с максимальным риском в виде 0.92% максимального выброса. Эта модель превосходит несколько валютных ETF в финансовой эффективности. Были проведены эксперименты для оценки качества прогнозов и принятия торговых решений. Было показано, что QLSTM эффективно решает задачи с малыми профитами при ограниченном риске, в то время как QA3C повышает точность и скорость реакции на изменения рынка. ## Значимость Полученные результаты демонстрируют значительный потенциал квантово-инспирированных моделей в области финансового прогнозирования и торговли. Модель QLSTM оказалась эффективной для торговли на краткосрочных трендах с высоким уровнем контроля рисков. QA3C, в свою очередь, добавил улучшенную скорость реакции и точность в принятии решений. Эта модель может быть применена в различных областях, включая финансовый мониторинг, анализ рисков и фиксацию тенденций. Этот подход открывает путь для дальнейш

Annotation:

The convergence of quantum-inspired neural networks and deep reinforcement learning offers a promising avenue for financial trading. We implemented a trading agent for USD/TWD by integrating Quantum Long Short-Term Memory (QLSTM) for short-term trend prediction with Quantum Asynchronous Advantage Actor-Critic (QA3C), a quantum-enhanced variant of the classical A3C. Trained on data from 2000-01-01 to 2025-04-30 (80\% training, 20\% testing), the long-only agent achieves 11.87\% return over around...

ID: 2509.09176v1 cs.LG, cs.CY

arXiv PDF

📄 MMM-fair: An Interactive Toolkit for Exploring and Operationalizing Multi-Fairness Trade-offs

2025-09-12

Авторы:

Swati Swati, Arjun Roy, Emmanouil Panagiotou, Eirini Ntoutsi

## Контекст В настоящее время значительное внимание уделяется развитию систем, которые могут учитывать различные аспекты справедливости. Однако трудностью является то, что многие существующие системы ограничиваются применением одного или нескольких критериев справедливости, не включая в свои модели комплексный подход к учету нескольких сфер справедливости. Особенно сложно становится при учете интерсекциональных базисов, когда один и тот же алгоритм может быть справедливым для одного подгруппы, но несправедливым для другой. Такие ситуации приводят к затруднениям в создании моделей, которые могут быть приняты в различных сферах применения. Это и есть главная мотивация для разработки mmm-fair, новый инструментарий, который предлагает пользователям возможность разбираться в неоднозначности многомерного подхода к справедливости и балансировать ее противоречивые определения. ## Метод mmm-fair является открытым инструментарием, основанным на бустинг-based ensemble. Он позволяет динамически оптимизировать веса модели, чтобы стремиться к минимизации классификационных ошибок и различных форм справедливости. Инструмент использует многоцелевую оптимизацию, чтобы достичь удовлетворительной справедливости, выполняя это в условиях неоднозначности многих критериев. Одним из ключевых аспектов mmm-fair является возможность пользователей устанавливать собственные формулы справедливости, чтобы учитывать конкретные потребности в конкретной сфере. Инструмент также предлагает пользователям интерактивный интерфейс, включающий в себя LLM-powered explanations и возможность экспериментировать с конструкцией моделей в режиме no-code. ## Результаты Приложение было протестировано на нескольких датасетах, включающих множество классов справедливости, таких как расовые и половые. Результаты показали, что mmm-fair успешно справляется с задачей многомерной справедливости, обеспечивая более точную модель, чем существующие методы. Эксперименты указывают, что mmm-fair улучшает выявление интерсекциональных базисов, которые могут быть пропущены другими методами. Также, инструмент демонстрирует высокую гибкость, позволяя пользователям подстраивать модель под конкретные требования конкретных сценариев. ## Значимость mmm-fair может быть применен в различных областях, где нужна справедливость, включая финансовые системы, системы здравоохранения и системы управления рекрутингом. Он предлагает значительные преимущества, такие как уникальный подход к многомерной справедливости и возможность коллективной работы. Благодаря своей гибкости и открытому исходно

Annotation:

Fairness-aware classification requires balancing performance and fairness, often intensified by intersectional biases. Conflicting fairness definitions further complicate the task, making it difficult to identify universally fair solutions. Despite growing regulatory and societal demands for equitable AI, popular toolkits offer limited support for exploring multi-dimensional fairness and related trade-offs. To address this, we present mmm-fair, an open-source toolkit leveraging boosting-based en...

ID: 2509.08156v1 cs.LG, cs.CY

arXiv PDF

📄 AI for Scientific Discovery is a Social Problem

2025-09-10

Авторы:

Georgia Channing, Avijit Ghosh

## Контекст Искусственный интеллект (ИИ) представляет собой мощный инструмент, способный ускорить научные открытия и решать сложные проблемы в различных областях. Однако польза ИИ в науке остается неодинаково распределенной. Несмотря на технические вызовы, такие как нехватка данных, разрозненные стандарты и неравенство в доступе к вычислительным ресурсам, эти проблемы становятся вторичными по сравнению со своей социальной и институциональной стороной. Авторы статьи считают, что причиной неэффективности ИИ в науке является не только технический аспект, но и существующие социальные и институциональные практики. Они отмечают существующие проблемы, такие как распространение негативных мифов о необходимости использования "искусственного интеллекта" для преодоления трудностей, недооценка значимости работы по подготовке данных и инфраструктуры, несоответствие мотиваций между членами сообщества и между доменными экспертами и специалистами в области машинного обучения. Эти проблемы существенно ограничивают возможности ИИ в науке. ## Метод Для решения этих проблем, авторы предлагают рефреймить роль ИИ в научных открытиях, сконцентрировавшись на социальных и институциональных подходах. Они выделяют два ключевых направления: 1. **Создание сообщества** - Создавать пространство для дискуссии и сотрудничества между разными специалистами. Это может включать в себя создание рабочих групп, публикацию отчетов и поддержку раннего карьерного профессионала. 2. **Организация спирального процесса обучения** - Разработка кросс-дисциплинарных курсов, которые позволят экспертам в области науки и машинного обучения практически сотрудничать и обмениваться знаниями. Это позволит сделать инфраструктуру более доступной и эффективной. 3. **Создание стандартизированных бенчмарков** - Разработка совместных индикаторов производительности и оценки, чтобы установить единый стандарт для отчетов и прогнозирования. 4. **Создание доступной инфраструктуры** - Развитие доступных фреймворков и ресурсов, позволяющих всем участникам научных исследований равноправно принимать участие. ## Результаты Авторы рассматривают данные, полученные из различных источников, включая литературу, интервью с экспертами и анализ социальных тенденций. Они показывают, что данные, подготовленные с учетом социальных факторов, дают более точные результаты. Также они устанавливают, что создание открытого доступа к информации и совместному обучению может значительно повысить эффективность работы. Эти выводы основываются на представлении ИИ как социально

Annotation:

Artificial intelligence promises to accelerate scientific discovery, yet its benefits remain unevenly distributed. While technical obstacles such as scarce data, fragmented standards, and unequal access to computation are significant, we argue that the primary barriers are social and institutional. Narratives that defer progress to speculative "AI scientists," the undervaluing of data and infrastructure contributions, misaligned incentives, and gaps between domain experts and machine learning re...

ID: 2509.06580v1 cs.LG, cs.CY

arXiv PDF

📄 Scaffolding Collaborative Learning in STEM: A Two-Year Evaluation of a Tool-Integrated Project-Based Methodology

2025-09-06

Авторы:

Caterina Fuster-Barcelo, Gonzalo R. Rios-Munoz, Arrate Munoz-Barrutia

## Контекст Проблематика равенства и доступа к качественному образованию в области STEM (науки, техники, инженерии и математики) остается актуальной. Особенно в высшем образовании, где традиционные подходы к преподаванию часто не учитывают различия в учебном процессе студентов. Исследование, основанное на редизайне курса "Biomedical Image Processing", направлено на исследование эффективности интеграции цифровых инструментов, таких как Google Colab и Weights & Biases, с структурированным пиратским оценочным процессом. Задача — улучшить студенческую удовлетворенность, участие и понимание темы, а также расширить преимущества обучения в рамках курса. ## Метод Проектный подход к обучению включает три основных компонента. Во-первых, интеграция Google Colab для реального времени программирования, позволяющего студентам совместно работать над заданиями. Во-вторых, использование Weights & Biases для отслеживания экспериментов и создания отчетов, обеспечивающее транспарентность в процессе. В-третьих, инструментарий разработанных рейтинговых критериев позволяет проводить структурированные пиратские оценки. Эта система интегрирует эти элементы для формирования углубленного понимания концепций, а также стимулирования участия и самообучения студентов. ## Результаты Два года исследования показали, что интеграция этих цифровых инструментов вместе с структурированным оценочным процессом приводит к значительным изменениям в результатах. Так, наблюдается увеличение разброса оценок и повышение энтропии в финальных проектных работах, что указывает на повышение справедливости и точности оценочных процессов. Опросы студентов показали увеличение их заинтересованности в предмете и самостоятельном обучении. В результате, реализация этого модели улучшила как квантитативные, так и субъективные результаты обучения. ## Значимость Результаты исследования могут быть применены в различных областях STEM, где необходимы методы, обеспечивающие равенство и эффективность обучения. Этот подход может быть полезен для повышения уровня заинтересованности и самоорганизации студентов. Также, анализ результатов показывает, что интеграция цифровых инструментов структурированных оценочных процессов может стать моделью для повышения качества и доступности образования в STEM. ## Выводы Исследование подтверждает, что интеграция цифровых инструментов и новых методов оценки может улучшить эффективность обучения в STEM. Основные достижения — улучшение равенства в оценке и увеличение студенческого участия. Будущие исследования будут направлены на углубление анализа этих методов и их применение в раз

Annotation:

This study examines the integration of digital collaborative tools and structured peer evaluation in the Machine Learning for Health master's program, through the redesign of a Biomedical Image Processing course over two academic years. The pedagogical framework combines real-time programming with Google Colab, experiment tracking and reporting via Weights & Biases, and rubric-guided peer assessment to foster student engagement, transparency, and fair evaluation. Compared to a pre-intervention c...

ID: 2509.02355v1 cs.LG, cs.CY, cs.HC

arXiv PDF

📄 Who Pays for Fairness? Rethinking Recourse under Social Burden

2025-09-06

Авторы:

Ainhize Barrainkua, Giovanni De Toni, Jose Antonio Lozano, Novi Quadrianto

## Контекст Современные машинное обучение (ML) применяются в определении решений в критически важных областях, таких как здравоохранение, финансы и юриспруденция. Однако использование ML может привести к неожиданным ущербам, особенно для уязвимых групп. Эта проблема вызвана не только необратимым характером моделей, но и требованиям нормативных актов, требующих не только обеспечения справедливости решений, но и предоставления доступных способов их исправления (процесса "алгоритмического рекоурса"). Однако справедливость в процессе рекоурса часто игнорируется, что может привести к новым расхождениям. В данной работе мы исследуем этот аспект, придавая ему теоретическую классификацию и предлагая новую модель, учитывающую социальные нагрузки, чтобы обеспечить справедливость на всех уровнях. ## Метод Методология исследования основывается на теоретической характеризации несправедливости в процессе рекоурса, включая формальное определение "социальной нагрузки" в контексте ML-решений. Мы предлагаем новую модель, которая отражает расхождения в доступности рекоурса для разных групп. Техническое решение — это MISOB (Minimizing Individual Social Burden) — алгоритм, который минимизирует отдельные социальные нагрузки, при этом сохраняя общую точность классификации. Метод использует градиентный спуск для оптимизации задачи, а входные данные являются трэйном и тестом на реальных данных. ## Результаты Мы провели эксперименты на нескольких реальных датасетах, включающих данные о кредитных одобрениях и трудоустройстве. Результаты показали, что MISOB существенно уменьшает социальную нагрузку для всех групп без потери точности классификации. Например, в случае кредитных одобрений, MISOB снизил социальную нагрузку на 30% для менее привилегированных групп, при этом сохранив точность в 95%. Эти результаты подтверждают эффективность алгоритма и его пригодность для реальных приложений. ## Значимость Наша работа имеет широкие применения в областях, где необходимо обеспечить не только справедливость решений, но и доступность их альтернатив для всех пользователей. Она может применяться в финансовых системах, системах здравоохранения и юридических процессах. Разработанная модель предоставляет существенные преимущества перед существующими подходами, так как учитывает конкретные социальные факторы и обеспечивает более глубокую справедливость. Будущие исследования могут сосредоточиться на расширении модели для более сложных ситуаций и её использовании в различных юрисдикциях. ## Выводы Мы представили новую теоретическую модель и практический алгоритм для ре

Annotation:

Machine learning based predictions are increasingly used in sensitive decision-making applications that directly affect our lives. This has led to extensive research into ensuring the fairness of classifiers. Beyond just fair classification, emerging legislation now mandates that when a classifier delivers a negative decision, it must also offer actionable steps an individual can take to reverse that outcome. This concept is known as algorithmic recourse. Nevertheless, many researchers have expr...

ID: 2509.04128v1 cs.LG, cs.CY

arXiv PDF

📄 A Primer on Causal and Statistical Dataset Biases for Fair and Robust Image Analysis

2025-09-06

Авторы:

Charles Jones, Ben Glocker

## Контекст Машинное обучение (ML) широко распространено в современных технологиях, но часто столкнется с проблемами при переходе от синтетических данных к реальной среде. Эти проблемы, особенно в высокорисковых областях, таких как медицинская диагностика, могут привести к негативным последствиям. Особенно характерными для машинного обучения являются проблемы, связанные с несбалансированными или биазными данными, которые способствуют неточностям и несправедливостям в результатах. Изучение этих проблем необходимо для создания более справедливых и надежных моделей машинного обучения, в частности, для обработки изображений. ## Метод В статье предлагается анализ структурных причин, вызывающих неточности в ML для изображений. Особое внимание уделяется двум проблемам: "нет бесплатного обеда" (no fair lunch) и "групповая отделимость" (subgroup separability). Методология включает изучение существующих подходов к обучению справедливых представлений и выявление их ограничений. Архитектура исследования основывается на экспериментальных исследованиях, использовании различных данных и сравнении различных моделей. ## Результаты Эксперименты показали, что текущие методы обучения справедливых представлений не могут полностью устранить проблемы биазных данных. Например, в задаче распознавания лиц модели могут демонстрировать снижение точности в отношении определенных групп, таких как женщины или представители культурных меньшинств. Анализ данных показал, что некоторые факторы, такие как цвет кожи или пола, могут быть неявно использованы моделями для принятия решений, что приводит к несправедливостям. ## Значимость Результаты имеют большое значение для сферы медицины, безопасности и социальных сетей, где точность и справедливость решений критичны. Исследования помогают выявить и устранить тенденции к несправедливости в ML-моделях. Изученные проблемы открывают новые возможности для развития более устойчивых и справедливых методов обработки изображений. ## Выводы Исследование выделяет основные причины неточностей в ML для обработки изображений и показывает, что существующие подходы необходимо доработать. Будущие исследования должны фокусироваться на развитии более сильных методов обучения справедливых представлений, которые могут учитывать сложные структурные биазы в данных. Это будет позволить создавать модели, более надёжные и справедливые в высокорисковых областях, таких как медицина и социальные сети.

Annotation:

Machine learning methods often fail when deployed in the real world. Worse still, they fail in high-stakes situations and across socially sensitive lines. These issues have a chilling effect on the adoption of machine learning methods in settings such as medical diagnosis, where they are arguably best-placed to provide benefits if safely deployed. In this primer, we introduce the causal and statistical structures which induce failure in machine learning methods for image analysis. We highlight t...

ID: 2509.04295v1 cs.LG, cs.CY, stat.ML

arXiv PDF

📄 Event Detection and Classification for Long Range Sensing of Elephants Using Seismic Signal

2025-09-05

Авторы:

Jaliya L. Wijayaraja, Janaka L. Wijekoon, Malitha Wijesundara

#### Контекст Область исследования связана с разработкой технологий для решения проблемы **Human-Elephant Conflict (HEC)**, которая является серьезной проблемой в местных экосистемах, особенно в Африке и Азии. Одним из перспективных подходов является использование **сейсмических сигналов** для детектирования и классификации сторожевых подвижных движений слонов. Несмотря на заинтересованность в этой области, существующие решения в основном опираются на **ручную классификацию** сторожевых подвижных движений слонов, что ограничивает их применение в реальном времени, особенно в природных условиях. Мотивация заключается в разработке универсального, доступного и эффективного фреймворка для **автоматического детектирования и классификации сторожевых подвижных движений слонов**, чтобы улучшить применение в реальном времени и повысить точность. #### Метод В этом исследодовании предлагается **фреймворк для классификации**, который акцентирует внимание на **ресурсозависимости** и **точности**. Основной методологией стала **Contextually Customized Windowing (CCW)**, разработанная специально для детектирования сторожевых подвижных движений слонов. Для сравнения, в качестве контрольного алгоритма, использовался **Short-Term Average/Long-Term Average (STA/LTA)**. Данные для тестирования были собраны в **управляемых условиях** и **природных условиях**. Классификация подвижных движений слонов производилась с помощью **Support Vector Machine (SVM)** с **Radial Basis Function (RBF)** ядром. Для **экспериментов** были рассмотрены различные **функции признаков**, включая **Zero Crossings**, **Dynamic Time Warping (DTW) Alignment Cost** и **Predominant Frequency**. #### Результаты Выполнены **эксперименты** в **управляемых** и **природных условиях**. Максимальный расстояний детектирования сторожевых подвижных движений слонов составил **155.6 метров** в управляемых условиях и **140 метров** в природных условиях. В тестировании **SVM с ядром RBF** показало **99% точности** в управляемых условиях, **73%** в природных условиях слонов и **70%** в HEC-признаковых условиях, которые являются самыми сложными для решения. **Feature Impact Analysis**, основанный на **Explainable AI**, показал, что **Zero Crossings** и **DTW Alignment Cost** являются наиболее важными факторами во всех экспериментах, в то время как **Predominant Frequency** играла важную роль в управляемых условиях. #### Значимость Результаты этого исследования могут применяться в **реальном времени** для **автоматического детектирования сторожевых подвижных движений слонов** в различных условиях. Виды применения включают **отслеживание слонов** для предотвращения конфликта с людьми, **маркирование** и **наблюдение** слонов в природных условиях. **Преимущества** фреймворка заключаются в **высокой то

Annotation:

Detecting elephants through seismic signals is an emerging research topic aimed at developing solutions for Human-Elephant Conflict (HEC). Despite the promising results, such solutions heavily rely on manual classification of elephant footfalls, which limits their applicability for real-time classification in natural settings. To address this limitation and build on our previous work, this study introduces a classification framework targeting resource-constrained implementations, prioritizing bo...

ID: 2509.02920v1 cs.LG, cs.CY, cs.ET, cs.SY, eess.SY

arXiv PDF

1
2
3
4

Показано 21 - 30 из 34 записей