📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Marius Miron, David Robinson, Milad Alizadeh, Ellen Gilsenan-McMahon, Gagan Narula, Emmanuel Chemla, Maddie Cusimano, Felix Effenberger, Masato Hagiwara, Benjamin Hoffman, Sara Keen, Diane Kim, Jane Lawton, Jen-Yu Liu, Aza Raskin, Olivier Pietquin, Matthieu Geist

## Контекст Биоакустика — это область исследований, которая изучает звуки, вырабатываемые живыми организмами. Она играет кллючевую роль в защите природы, мониторинге биоразнообразия и изучении поведения. Многие задачи в этой области, такие как классификация видов, идентификация индивидов, определение поведения и детекция, хорошо подходят для применения машинного обучения. Однако эти задачи часто сталкиваются с ограниченным количеством отмеченных данных, что создает необходимость в разработке универсального биоакустического кодировщика, который мог бы извлекать полезные представления для различных задач. Однако, существующие подобные модели часто ограничены в своем применении, ориентируясь только на определенные виды (например, птиц) и ограничиваются одним конкретным архитектурным решением или подходом к обучению. В настоящем исследовании мы стремимся охватить более широкий круг факторов, влияющих на эффективность биоакустических моделей, включая разнообразие данных, архитектуры моделей и их применение к различным задачам. ## Метод Мы проводим широкомасштабное эмпирическое исследование, которое включает в себя различные аспекты биоакустики, которые ранее не получали должного внимания. Обучаемая данная модель должна работать с разнообразными биоакустическими данными, включая звуки птиц, животных и других организмов. Мы используем две стадии обучения: пре-тренировку самостоятельного основанного на аудио и последующую супервизированную подготовку на смешанном корпусе биоакустических и общих аудиоданных. Эта модель проверяется на 26 различных данных, включая классификацию видов, определение индивидов, детекцию и возможность открытия вокального репертора. Мы оцениваем архитектуры моделей, варианты обучения и различные варианты предварительной обработки данных. Эксперименты проводятся на различных уровнях абстракции, чтобы понять, какие факторы имеют наибольшее значение для работы модели. ## Результаты Мы получили модели с самыми высокими показателями на существующих и проведенных нами бенчмарках. Мы провели подробный анализ, в котором выявили, что самостоятельная предварительная обученность (self-supervised pre-training), следующая за супервизированной подготовкой на смешанном корпусе данных, дает наилучший результат как на одной конкретной дате, так и при переносе модели на другие таски и данные. Мы также показали, что разнообразие данных, как в предварительной, так и в последующей стадии обучения, является критическим для достижения лучших результатов. Мы также выявили, что увеличение различных типов задач и разнообразия данных
Annotation:
Bioacoustics, the study of sounds produced by living organisms, plays a vital role in conservation, biodiversity monitoring, and behavioral studies. Many tasks in this field, such as species, individual, and behavior classification and detection, are well-suited to machine learning. However, they often suffer from limited annotated data, highlighting the need for a general-purpose bioacoustic encoder capable of extracting useful representations for diverse downstream tasks. Such encoders have be...
ID: 2508.11845v2 cs.SD, cs.AI, cs.IR, cs.LG
Авторы:

Marius Miron, David Robinson, Milad Alizadeh, Ellen Gilsenan-McMahon, Gagan Narula, Olivier Pietquin, Matthieu Geist, Emmanuel Chemla, Maddie Cusimano, Felix Effenberger, Masato Hagiwara, Benjamin Hoffman, Sara Keen, Diane Kim, Jane Lawton, Jen-Yu Liu, Aza Raskin

## Контекст Биоакустика — это наука, изучающая звуки, вырабатываемые живыми организмами. Она играет ключевую роль в защите природы, мониторинге биоразнообразия и изучении поведения животных. Однако многие задачи в этой области, такие как классификация видов, идентификация индивидуумов и изучение поведения, сталкиваются с ограничениями по объему аннотированных данных. Это сподвигло исследователей искать общего назначения модели, которая могла бы эффективно извлекать представления для различных задач. Несмотря на то, что такие модели были предложены ранее, они часто ограничиваются спецификой видов (обычно птиц) и ограниченным набором задач и данных. Данная работа предлагает широкомасштабное исследование новых аспектов биоакустики, которые до сих пор не были достаточно раскрыты, включая разнообразие и объем выборок, архитектуры моделей и широту задач, на которых они тестируются. ## Метод Работа представляет собой широкомасштабное исследование, охватывающее 26 датасетов с задачами, такими как классификация видов, идентификация индивидуумов, выявление голосовых реперториев и другие. Использовались различные модели и архитектуры, включая самостоятельно предсказуемые модели, которые получали предварительную обученность на биоакустических данных и дополнительной обученностью на общей коллекции аудио. Основной фокус был на сравнении различных архитектур, способов обучения и методов предварительной обученности, чтобы определить, что действительно влияет на эффективность решения задач биоакустики. Были проведены эксперименты для определения взаимосвязей между различными факторами, такими как объем данных, виды архитектур моделей и методы обучения. ## Результаты Предложенные модели показали состояние техники на широком спектре задач и датасетов. Оказалось, что самостоятельно предсказуемые модели, которые прошли предварительное обучение на биоакустических данных и дополнительно обучались на общей коллекции аудио, демонстрируют лучшие результаты в классификации видов, идентификации индивидуумов и других задачах. Было выявлено, что данные, использованные для обучения, имеют большое значение — как для процесса предварительного обучения, так и для последующего супервизованного обучения. Особое внимание было уделено влиянию различных архитектур и методов обучения на качество решения задач. Результаты показали, что модели, которые прошли предварительное обучение и дополнительно обучались на миксе биоакустических и общих аудиоданных, показали лучшие результаты в кросс-датасетных экспериментах. ## Значимость Ис
Annotation:
Bioacoustics, the study of sounds produced by living organisms, plays a vital role in conservation, biodiversity monitoring, and behavioral studies. Many tasks in this field, such as species, individual, and behavior classification and detection, are well-suited to machine learning. However, they often suffer from limited annotated data, highlighting the need for a general-purpose bioacoustic encoder capable of extracting useful representations for diverse downstream tasks. Such encoders have be...
ID: 2508.11845v1 cs.SD, cs.AI, cs.IR, cs.LG