January Food Benchmark (JFB): A Public Benchmark Dataset and Evaluation Suite for Multimodal Food Analysis
2508.09966v1
cs.CV, cs.AI
2025-08-15
Авторы:
Amir Hosseinian, Ashkan Dehghani Zahedani, Umer Mansoor, Noosheen Hashemi, Mark Woodward
Резюме на русском
#################################
## Контекст
#################################
Актуальность исследования связана с ростом интереса к автоматизированному анализу пищевых продуктов, который может помочь в улучшении здоровья и благополучия человека. Однако существуют существенные проблемы, связанные с отсутствием стандартизированных методологий и высококачественных данных для обучения и оценки алгоритмов. Недостаточная точность и универсальность нынешних моделей приводят к затруднениям в их применении в реальных условиях. Для решения этих проблем необходимо разработать специализированные модели и детально протестировать их на реальных данных.
#################################
## Метод
#################################
Для решения проблемы разработаны три основных компонента. Во-первых, создан January Food Benchmark (JFB) — публичный набор данных, состоящий из 1 000 изображений пищевых продуктов с подробными, вручную подтвержденными пометками. Во-вторых, разработан подробный фреймворк для оценки моделей, включая метрики, оценивающие различные аспекты производительности, и уникальный общий показатель для оценки моделей в целом. В-третьих, разработана и протестирована специализированная модель january/food-vision-v1, которая предназначена для решения задачи анализа пищевых продуктов.
#################################
## Результаты
#################################
Использовались данные из JFB для оценки производительности моделей. Обширные эксперименты показали, что специализированная модель january/food-vision-v1 превосходит общеупотребительные модели, достигая Overall Score 86.2, что является значительным улучшением (12.1 балла) по сравнению с лучшим результатом общего назначения. Эти результаты указывают на эффективность специализированных моделей в решении задач автоматизированного анализа пищевых продуктов.
#################################
## Значимость
#################################
Разработанный JFB может быть применен в различных областях, включая развитие моделей для автоматизации группирования и анализа пищевых продуктов. Он предоставляет уникальные возможности для развития инструментов, помогающих в обеспечении здорового питания и стимулировании здорового образа жизни. Эта работа также открывает пути для дальнейшего исследования в области мультимодального анализа, включая расширение технологий для оценки качества и безопасности пищи.
#################################
## Выводы
#################################
Работа представляет собой значительный шаг в развитии автоматизированных систем анализа пищевых продуктов. Выпущенный JFB и соответствующий фреймворк дают возможность для последовательных развитий в этой области. Будущие исследования будут фокусироваться на улучшении моделей, расширении JFB и исследовании применений в реальной жизни.
Abstract
Progress in AI for automated nutritional analysis is critically hampered by
the lack of standardized evaluation methodologies and high-quality, real-world
benchmark datasets. To address this, we introduce three primary contributions.
First, we present the January Food Benchmark (JFB), a publicly available
collection of 1,000 food images with human-validated annotations. Second, we
detail a comprehensive benchmarking framework, including robust metrics and a
novel, application-oriented overall score designed to assess model performance
holistically. Third, we provide baseline results from both general-purpose
Vision-Language Models (VLMs) and our own specialized model,
january/food-vision-v1. Our evaluation demonstrates that the specialized model
achieves an Overall Score of 86.2, a 12.1-point improvement over the
best-performing general-purpose configuration. This work offers the research
community a valuable new evaluation dataset and a rigorous framework to guide
and benchmark future developments in automated nutritional analysis.
Ссылки и действия
Дополнительные ресурсы: