Towards Universal Neural Inference
2508.09100v1
cs.LG, cs.AI
2025-08-14
Авторы:
Shreyas Bhat Brahmavar, Yang Li, Junier Oliva
Резюме на русском
## Контекст
На сегодняшний день, существуют многочисленные данные, представленные в различных формах, с неоднородными схемами, несогласованными семантиками и неупорядоченными признаками. Эта сложность сильно ограничивает возможности создания универсальных моделей, которые могут обрабатывать такие данные с высокой точностью. Одной из основных проблем является невозможность эффективного использования информации из различных источников. Данная проблема является мотивацией для разработки моделей, которые могут обрабатывать уникальные структуры данных и выполнять семантическое выводение в различных контекстах.
## Метод
Мы предлагаем **ASPIRE (Arbitrary Set-based Permutation-Invariant Reasoning Engine)**, универсальную модель для семантического вывода и предсказания, работающую с неоднородными, структурированными данными. Архитектура ASPIRE основывается на **Transformer с пермутационно-независимой обработкой множеств**, который позволяет обрабатывать неограниченные наборы фичей и значений. Для улучшения обучения, ASPIRE использует модуль семантического граундинга, включающий в себя естественный язык, метаданные данных и примеры в контексте. Это позволяет модели учитывать зависимости между признаками, даже при работе с данными из различных источников.
## Результаты
Мы провели эксперименты с ASPIRE на различных бенчмарках, сравнивая результаты с другими подходами. Модель показала сильную универсальность и способность сделать предсказания даже для неизвестных данных. Мы также проверили ее в условиях **активного выбора признаков** в открытом мире, когда необходимо выбирать наиболее информативные признаки с учетом ограничений бюджета. ASPIRE показала себя эффективной в этих задачах, чтобы доказать свою универсальность и применимость в различных сценариях.
## Значимость
ASPIRE открывает новые возможности для обработки разнообразных структурированных данных в различных областях, включая бизнес-аналитику, медицину и технические приложения. Она может использоваться для вывода семантики, предсказания и активного выбора признаков. Её универсальность и способность учитывать метаданные данных делают её особенно ценной в ситуациях, когда требуется обработка неоднородных данных без дополнительной настройки.
## Выводы
Результаты нами полученные показывают, что ASPIRE является универсальной моделью семантического вывода, которая может обрабатывать неоднородные данные в различных сферах. Будущие исследования будут сконцентрированы на улучшении модели, особенно в области уменьшения потребления ресурсов и расширении её применения в более комплексных сценариях.
Abstract
Real-world data often appears in diverse, disjoint forms -- with varying
schemas, inconsistent semantics, and no fixed feature ordering -- making it
challenging to build general-purpose models that can leverage information
across datasets. We introduce ASPIRE, Arbitrary Set-based Permutation-Invariant
Reasoning Engine, a Universal Neural Inference model for semantic reasoning and
prediction over heterogeneous structured data. ASPIRE combines a
permutation-invariant, set-based Transformer with a semantic grounding module
that incorporates natural language descriptions, dataset metadata, and
in-context examples to learn cross-dataset feature dependencies. This
architecture allows ASPIRE to ingest arbitrary sets of feature--value pairs and
support examples, align semantics across disjoint tables, and make predictions
for any specified target. Once trained, ASPIRE generalizes to new inference
tasks without additional tuning. In addition to delivering strong results
across diverse benchmarks, ASPIRE naturally supports cost-aware active feature
acquisition in an open-world setting, selecting informative features under
test-time budget constraints for an arbitrary unseen dataset. These
capabilities position ASPIRE as a step toward truly universal, semantics-aware
inference over structured data.
Ссылки и действия
Дополнительные ресурсы: