FoodSEM: Large Language Model Specialized in Food Named-Entity Linking

2509.22125v1 cs.CL, cs.IR 2025-09-30
Авторы:

Ana Gjorgjevikj, Matej Martinc, Gjorgjina Cenikj, Sašo Džeroski, Barbara Koroušić Seljak, Tome Eftimov

Резюме на русском

## Контекст Последние годы стали особенно актуальным развитием искусственных нейронных сетей (ANN), которые нашли широкое применение в обработке естественного языка. Одним из важных технических заданий в этой области является named-entity linking (NEL), которое состоит в связывании сущностей в тексте с определенными семантическими сущностями в указанных справочниках (ontologies). Для многих областей, таких как медицина и юриспруденция, NEL является ключевым средством для обработки и анализа текстов. Единственной проблемой является то, что до сих пор нет моделей, которые могли бы выполнять NEL в сфере питания и продуктов питания с достаточной точностью. Таким образом, FoodSEM был создан как решение для этой цели. ## Метод FoodSEM является fine-tuned версией стандартной модели и использует процедуры инструкционно-ответного сценария (IR) для того, чтобы связать сущности в тексте с семантическими сущностями в справочниках. Модель была обучена на подготовленном корпусе данных в формате для инструкционного решения задач (IR). Корпус содержит текстовые примеры, которые были созданы специально для этой задачи. Модель FoodSEM может связывать сущности, такие как "сыр", "кукуруза" и "вино" с такими справочниками, как FoodOn, SNOMED-CT и Hansard taxonomy. Использованная технология включает в себя не только обучение с подкреплением, но и постобучение модели с использованием новых данных. ## Результаты Проведенные эксперименты показали, что FoodSEM выдает результаты с F1-мерой до 98% на некоторых датасетах и справочниках. В сравнении с нетюнированными моделями (zero-shot, one-shot и few-shot prompting), FoodSEM показала значительное преимущество. Это свидетельствует о том, что fine-tuning может значительно повысить точность решения задачи NEL в сфере питания. Использованные данные включили большой набор текстов, полученных из различных источников, что дало возможность модели учиться распознавать различные структуры текста и связывать их с соответствующими сущностями в справочниках. ## Значимость FoodSEM может быть применена в различных областях, таких как исследования питания, менеджмент продуктов питания и логистика сельскохозяйственных продуктов. Эта модель позволяет повысить точность в обработке текстов, связанных с продуктами питания, и сделать более надежным процесс семантического понимания. Например, FoodSEM может быть использована в системах управления складами продуктов питания, в системах подбора рецептов и даже в образовательных целях. За счет публикации FoodSEM и его ресурсов, модель может стать стандартом для будущих исследований в этой области. ## Выводы FoodSEM является первой моделью, которая способна выполнять named-entity

Abstract

This paper introduces FoodSEM, a state-of-the-art fine-tuned open-source large language model (LLM) for named-entity linking (NEL) to food-related ontologies. To the best of our knowledge, food NEL is a task that cannot be accurately solved by state-of-the-art general-purpose (large) language models or custom domain-specific models/systems. Through an instruction-response (IR) scenario, FoodSEM links food-related entities mentioned in a text to several ontologies, including FoodOn, SNOMED-CT, and the Hansard taxonomy. The FoodSEM model achieves state-of-the-art performance compared to related models/systems, with F1 scores even reaching 98% on some ontologies and datasets. The presented comparative analyses against zero-shot, one-shot, and few-shot LLM prompting baselines further highlight FoodSEM's superior performance over its non-fine-tuned version. By making FoodSEM and its related resources publicly available, the main contributions of this article include (1) publishing a food-annotated corpora into an IR format suitable for LLM fine-tuning/evaluation, (2) publishing a robust model to advance the semantic understanding of text in the food domain, and (3) providing a strong baseline on food NEL for future benchmarking.

Ссылки и действия