📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Kathy Garcia, Leyla Isik

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Humans intuitively perceive complex social signals in visual scenes, yet it remains unclear whether state-of-the-art AI models encode the same similarity structure. We study (Q1) whether modern video and language models capture human-perceived similarity in social videos, and (Q2) how to instill this structure into models using human behavioral data. To address this, we introduce a new benchmark of over 49,000 odd-one-out similarity judgments on 250 three-second video clips of social interaction...
ID: 2510.01502v1 q-bio.NC, cs.CV, cs.LG
Авторы:

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Understanding how neural populations in higher visual areas encode object-centered visual information remains a central challenge in computational neuroscience. Prior works have investigated representational alignment between artificial neural networks and the visual cortex. Nevertheless, these findings are indirect and offer limited insights to the structure of neural populations themselves. Similarly, decoding-based methods have quantified semantic features from neural populations but have not...
ID: 2510.02182v1 q-bio.NC, cs.CV, cs.LG
Авторы:

Maria F. Alcala-Durand, J. Camilo Puerta-Acevedo, Julián D. Arias-Londoño, Juan I. Godino-Llorente

## Контекст Визуальные исследования являются важной частью диагностики различных медицинских условий, в том числе новородических тревог и нервных расстройств. Одним из наиболее распространенных заболеваний, вызывающих серьезные последствия для здоровья, является Паркинсоновое заболевание (PD). Это хроническое, прогрессирующее заболевание, приводящее к повреждению нервной системы, обычно связанное с потерей моторных и немоторных функций. Одним из ключевых признаков PD является изменение окулиомоторных характеристик, таких как глазодвижения, скорость реакции и точность слежения за объектом. Изучение этих признаков может помочь раннему выявлению заболевания, что дает возможность начать лечение в оптимальный период. Тем не менее, существующие методы диагностики часто требуют дорогостоящих инструментов или трудоемких стендов, что ограничивает широкое применение. Мотивирует разработку автоматизированного метода скрининга PD с использованием визуальных исследований, который может быть экономичным и доступным. ## Метод Для оценки окулиомоторных характеристик в рамках диагностики PD была разработана новая методология, которая объединяет классические признаки глаза (например, частота сканирования, продолжительность фиксации, объем сканируемой области) с новыми признаками, основывающимися на кластерах глазных движений (т.е., зонах существенной накопления фиксаций). Эти признаки были извлечены автоматически из шести разных тестов визуального исследования. Для анализа этих признаков было применено множество машинных обучающихся алгоритмов, включая энсемблы Mixture of Experts (MoE). Модель MoE позволяет объединять результаты отдельных классификаторов для улучшения точности и общей производительности. Данные для экспериментов были получены в рамках шести разных тестов, включающих визуальное сканирование различных объектов и базовых возможностей глаза. ## Результаты Эксперименты показали, что модель Mixture of Experts дает высокую точность диагностики PD, с AUC (Receiver Operating Characteristic) 0.95 на тестовой выборке. Это значительно превышает результаты отдельных классификаторов. Также было обнаружено, что признаки, полученные из кластеров глазных движений, дают более сильные признаки, чем классические признаки окулиомоторных характеристик. Эти результаты подтверждают, что визуальные исследования могут дать доступ к ранней диагностике PD, что делает их привлекательным инструментом для неинвазивного скрининга. ## Значимость Результаты этого исследования открывают новые возможности для легкого и неинвазивного скрининга PD. Исполь
Annotation:
Eye movements can reveal early signs of neurodegeneration, including those associated with Parkinson's Disease (PD). This work investigates the utility of a set of gaze-based features for the automatic screening of PD from different visual exploration tasks. For this purpose, a novel methodology is introduced, combining classic fixation/saccade oculomotor features (e.g., saccade count, fixation duration, scanned area) with features derived from gaze clusters (i.e., regions with a considerable ac...
ID: 2509.01326v1 q-bio.NC, cs.CV, cs.LG
Авторы:

Antonino Greco, Marco D'Alessandro, Karl J. Friston, Giovanni Pezzulo, Markus Siegel

## Контекст В области визуального обработки существует длительное противоречие между функциональной ролью верхне-внизу (top-down) мозговых путей и их отсутствием в существующих моделях артифициального видения. Хотя биологические системы такие как мозг человека используют верхне-внизу мозговые пути для улучшения визуального распознавания, большинство моделей искусственного видения основываются лишь на нижне-вверху (feedforward) или рекуррентных архитектурах. Эта разница поднимает вопросы о функциональной важности верхне-внизу мозговых путей. Мотивируется поиском разъяснения, как верхне-внизу мозговые пути могут вкладывать в визуальную процессингу, и как они могут быть реализованы в моделировании. ## Метод Для изучения этой проблемы в данном исследовании использовались конволюционные рекуррентные нейронные сети (ConvRNN). Эти модели были обучены классифицировать изображения, со включенным и отключенным верхне-внизу мозговыми путями. Была также внедрена техника стохастической нейронной вариабельности, в частности, dropout, которая случайным образом подавляла отдельные нейроны в каждой итерации обучения. Эта реализация значительно увеличила результат модели, демонстрируя важность нейронной вариабельности и верхне-внизу мозговых путей для улучшения визуальной обработки. ## Результаты Исследования показали, что ConvRNNs с верхне-внизу мозговыми путями и dropout имели значительные преимущества в скорости обучения и точности. Эти модели были менее чувствительны к шумным помехам и атакам адверсарных входов. Репрезентация выходного слоя, полученная с верхне-внизу мозговыми путями и dropout, стала более оптимальна, что привело к сжатой, но эффективной кодированию информации. Также выявлено, что верхне-внизу мозговые пути способствуют устойчивости динамики сети в условиях выхода за пределы дистрибуции (out-of-distribution). ## Значимость Результаты этого исследования имеют широкие приложения в области искусственного видения, включая обработку изображений, обнаружение объектов и понимание языка. Модель с верхне-внизу мозговыми путями и dropout может использоваться в ситуациях, где необходимо высокое разрешение, высокая производительность и устойчивость к помехам. Также модель может применяться в ситуациях, где важно обеспечить точность, даже при неоптимальных условиях ввода. ## Выводы Выводы показывают, что верхне-внизу мозговые пути и нейронная вариабельность играют ключевую роль в улучшении визуальной обработки. Верхне-внизу мозговые пути помогают стабилизировать динамику сети, в то в
Annotation:
Biological systems leverage top-down feedback for visual processing, yet most artificial vision models succeed in image classification using purely feedforward or recurrent architectures, calling into question the functional significance of descending cortical pathways. Here, we trained convolutional recurrent neural networks (ConvRNN) on image classification in the presence or absence of top-down feedback projections to elucidate the specific computational contributions of those feedback pathwa...
ID: 2508.07115v1 q-bio.NC, cs.CV, cs.LG