## Контекст
Проблематика понимания и выражения временных концепций в текстах естественного языка широко изучается в области искусственного интеллекта. Однако существуют значительные трудности в выделении и использовании временных коммерсиантов, которые неявно представлены в тексте. Например, для того, чтобы понять, что музейный тур может длиться несколько часов, но не может длиться несколько месяцев, требуется не только понимание языка, но и коммуникативных контекстных сведений. Такие сложности создают препятствия для создания надежных языковых моделей. Мотивирует решение этой проблемы желание улучшить возможности текстовых моделей в сфере естественного языка, основываясь на обобщении и автоматизации временных коммерсиантов.
## Метод
В нашем исследовании мы предлагаем подход, основанный на машинном обучении, для выделения временных коммерсиантов из текстов. Мы используем доступные текстовые модели, такие как BERT и GPT-2, в качестве основы для построения нашей экспериментальной среды. Чтобы получить данные для обучения, мы строим TComQA, датасет, полученный из существующих коллекций SAMSum и RealNews. Данные трансформируются с помощью автоматических алгоритмов для выделения временных свойств. Мы также применяем техники разметки и валидации для обеспечения качества данных. Таким образом, мы создаем датасет, который может эффективно обучать модели понимания временных концепций.
## Результаты
Мы проводим эксперименты с TComQA для оценки его эффективности в выделении временных коммерсиантов. Для этого мы используем модели, которые обучаются на нашем датасете и сравниваем их с современными моделями текстового понимания. Также мы проводим кросс-валидацию, чтобы проверить точность и надежность наших результатов. Результаты показывают, что модели, обученные на TComQA, достигают высокой точности — 80,4%, что значительно превышает результаты моделей, обученных на других датасетах. Это демонстрирует эффективность нашего подхода в достижении целей.
## Значимость
Наш подход имеет значительное значение для развития текстовых моделей, особенно в сферах, требующих высокого уровня компрессии и понимания контекста. Мы показываем, что данные TComQA могут быть использованы для улучшения текстовых моделей в области естественного языка. Это может привести к улучшению хранения и извлечения информации, а также к предотвращению неточностей в генерации текста. Кроме того, наш подход открывает пути к развитию новых технологий, включая системы вопросов-ответов и автоматическое разметки текстов, что может повлиять на развитие интеллектуальных систем в целом.
## Выводы
Мы пре