📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Sola Shirai, Kavitha Srinivas, Julian Dolby, Michael Katz, Horst Samulowitz, Shirin Sohrabi

## Контекст Графы широко используются в различных областях, включая социальные сети, финансы и биологию. Однако решение задач, связанных с графами, часто требует специализированных алгоритмов и моделей. Большие языковые модели (LLMs), оснащенные мощным способом обработки текста, могут быть применены для решения таких задач. Тем не менее, существуюют сомнения в том, могут ли LLMs решать задачи графа независимо от сериализованных в виде текста данных, и какие подходы окажутся эффективными. Мотивирует это желание упростить процесс решения задач графов, уменьшив необходимость в дополнительных сложностях, таких как сериализация данных и использование специализированных моделей. ## Метод Исследование основывается на использовании LLMs, обученных с использованием цепочки мышления (chain-of-thought), для решения задач графов. Для этого рассматриваются несколько подходов: (1) традиционная сериализация графов в текст, (2) использование LLMs с цепочкой мышления для прямого решения задач, и (3) рекуррентное обучение с учетом цепочки мышления. Отдельное внимание уделяется экспериментам с различными архитектурами графов и размерами моделей. Таким образом, исследование сосредоточено на сравнении эффективности разных подходов и их общих возможностей в решении задач графов. ## Результаты В ходе экспериментов были проанализированы различные модели, включая LLMs с разным объемом параметров и различными типами графов. Наблюдалось, что даже небольшие модели с цепочкой мышления способны решать базовые задачи графов, включая поиск пути и нахождение кратчайшей цепи. Более того, эти модели могут общаться с неизвестными графами и задачами, не прибегая к сериализации. В сравнении с традиционными подходами, основывающимися на сериализации данных или комбинации GNNs и LLMs, LLMs с цепочкой мышления показали выигрыш в скорости обучения и гибкости при увеличении задач и графов. ## Значимость Полученные результаты открывают новые возможности для использования LLMs в области графовых задач. Они предлагают упрощенный подход, не требующий сериализации данных или специального графового представления. Это может привести к значительной экономии ресурсов и ускорению процесса решения задач в различных приложениях, включая социальные сети, бизнес-анализ и биоинформатику. Более того, полученные преимущества могут открыть новые пути для использования графов в области искусственного интеллекта. ## Выводы Результаты исследования показывают, что LLMs, обученные с использованием цепочки мышления, могут эффекти
Annotation:
For large language models (LLMs), reasoning over graphs could help solve many problems. Prior work has tried to improve LLM graph reasoning by examining how best to serialize graphs as text and by combining GNNs and LLMs. However, the merits of such approaches remain unclear, so we empirically answer the following research questions: (1) Can LLMs learn to solve fundamental graph tasks without specialized graph encoding models?, (2) Can LLMs generalize learned solutions to unseen graph structures...
ID: 2508.10115v1 cs.LG, cs.AI, I.2.7; I.2.6; I.5.1