RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическая физика и компьютерное моделирование // Архив

Математическая физика и компьютерное моделирование, 2020, том 23, выпуск 4, страницы 56–68 (Mi vvgum296)

Моделирование, информатика и управление

Автоматизация процесса метаразметки архивных документов

Д. Ю. Филимонов, А. В. Светлов, О. А. Горбань, М. В. Косова, Е. М. Шептухина

Волгоградский государственный университет

Аннотация: Работа посвящена описанию созданного авторами статьи приложения для поиска определенных заранее заданных шаблонов в обрабатываемых текстах. Данные шаблоны описываются специально разработанной системой маркеров, специфических для ряда рассматриваемых документов. Основное назначение данного приложения — подготовка метаразметки документов архивного фонда «Михайловский станичный атаман» для создания лингвистического корпуса. В ходе работы над приложением была решена задача корректного определения документов четырех типов — войсковая грамота, рапорт, доношение и известие — а также их описательных характеристик.

Ключевые слова: автоматизация лингвистического анализа, автоматизация метаразметки, графический интерфейс, корпусная лингвистика, регулярные выражения.

УДК: 004.91, 81’33, 004.42
ББК: 32.973, 81.1

Поступила в редакцию: 02.09.2020

DOI: 10.15688/mpcm.jvolsu.2020.4.6



© МИАН, 2024