Аннотация:
Статья посвящена анализу возможности применения языка
TimeML для разметки временных выражений и их связей с упоминаниями событий в русскоязычных текстах.
Выявлен ряд специфических для русского языка конструкций, требующих внесения корректив в инструкцию для аннотаторов, предложены варианты изменений отдельных пунктов инструкции.
В заключении делается вывод о целесообразности практического приложения доработанной версии языка TimeML к русскоязычным текстам как в качестве языка разметки, так и в качестве формата представления извлекаемой автоматически темпоральной информации.
Ключевые слова и фразы:автоматическая обработка текста, извлечение информации, разметка корпусов текстов, темпоральные выражения.
УДК:
004.89:004.912
Поступила в редакцию: 16.11.2016 Подписана в печать : 26.12.2016