FoodSEM: Large Language Model Specialized in Food Named-Entity Linking
2509.22125v1
cs.CL, cs.IR
2025-09-30
Авторы:
Ana Gjorgjevikj, Matej Martinc, Gjorgjina Cenikj, Sašo Džeroski, Barbara Koroušić Seljak, Tome Eftimov
Резюме на русском
## Контекст
Последние годы стали особенно актуальным развитием искусственных нейронных сетей (ANN), которые нашли широкое применение в обработке естественного языка. Одним из важных технических заданий в этой области является named-entity linking (NEL), которое состоит в связывании сущностей в тексте с определенными семантическими сущностями в указанных справочниках (ontologies). Для многих областей, таких как медицина и юриспруденция, NEL является ключевым средством для обработки и анализа текстов. Единственной проблемой является то, что до сих пор нет моделей, которые могли бы выполнять NEL в сфере питания и продуктов питания с достаточной точностью. Таким образом, FoodSEM был создан как решение для этой цели.
## Метод
FoodSEM является fine-tuned версией стандартной модели и использует процедуры инструкционно-ответного сценария (IR) для того, чтобы связать сущности в тексте с семантическими сущностями в справочниках. Модель была обучена на подготовленном корпусе данных в формате для инструкционного решения задач (IR). Корпус содержит текстовые примеры, которые были созданы специально для этой задачи. Модель FoodSEM может связывать сущности, такие как "сыр", "кукуруза" и "вино" с такими справочниками, как FoodOn, SNOMED-CT и Hansard taxonomy. Использованная технология включает в себя не только обучение с подкреплением, но и постобучение модели с использованием новых данных.
## Результаты
Проведенные эксперименты показали, что FoodSEM выдает результаты с F1-мерой до 98% на некоторых датасетах и справочниках. В сравнении с нетюнированными моделями (zero-shot, one-shot и few-shot prompting), FoodSEM показала значительное преимущество. Это свидетельствует о том, что fine-tuning может значительно повысить точность решения задачи NEL в сфере питания. Использованные данные включили большой набор текстов, полученных из различных источников, что дало возможность модели учиться распознавать различные структуры текста и связывать их с соответствующими сущностями в справочниках.
## Значимость
FoodSEM может быть применена в различных областях, таких как исследования питания, менеджмент продуктов питания и логистика сельскохозяйственных продуктов. Эта модель позволяет повысить точность в обработке текстов, связанных с продуктами питания, и сделать более надежным процесс семантического понимания. Например, FoodSEM может быть использована в системах управления складами продуктов питания, в системах подбора рецептов и даже в образовательных целях. За счет публикации FoodSEM и его ресурсов, модель может стать стандартом для будущих исследований в этой области.
## Выводы
FoodSEM является первой моделью, которая способна выполнять named-entity
Abstract
This paper introduces FoodSEM, a state-of-the-art fine-tuned open-source
large language model (LLM) for named-entity linking (NEL) to food-related
ontologies. To the best of our knowledge, food NEL is a task that cannot be
accurately solved by state-of-the-art general-purpose (large) language models
or custom domain-specific models/systems. Through an instruction-response (IR)
scenario, FoodSEM links food-related entities mentioned in a text to several
ontologies, including FoodOn, SNOMED-CT, and the Hansard taxonomy. The FoodSEM
model achieves state-of-the-art performance compared to related models/systems,
with F1 scores even reaching 98% on some ontologies and datasets. The presented
comparative analyses against zero-shot, one-shot, and few-shot LLM prompting
baselines further highlight FoodSEM's superior performance over its
non-fine-tuned version. By making FoodSEM and its related resources publicly
available, the main contributions of this article include (1) publishing a
food-annotated corpora into an IR format suitable for LLM
fine-tuning/evaluation, (2) publishing a robust model to advance the semantic
understanding of text in the food domain, and (3) providing a strong baseline
on food NEL for future benchmarking.
Ссылки и действия
Дополнительные ресурсы: