RUS  ENG
Полная версия
ЖУРНАЛЫ // Программные системы: теория и приложения // Архив

Программные системы: теория и приложения, 2024, том 15, выпуск 3, страницы 75–110 (Mi ps452)

Прикладные программные системы

Recovering text sequences using deep learning models

[Восстановление текстовых последовательностей с использованием моделей глубокого обучения]

I. V. Vinokurov

Financial University under the Government of the Russian Federation, Moscow, Russia

Аннотация: В статье приведены результаты формирования, обучения и оценки качества работы моделей с архитектурами Encoder-Decoder и Sequence-To-Sequence (Seq2Seq) для решения задачи дополнения неполных текстов. Задачи такого типа достаточно часто возникают при восстановлении содержимого документов по их некачественным изображениям. Проведённые в работе исследования ориентированы на решение практической задачи формирования электронных копий отсканированных документов ППК «Роскадастр», распознавание которых стандартными средствами затруднительно или невозможно.
Формирование и исследование моделей осуществлялось на языке Python с использованием высокоуровневого API пакета Keras. С целью обучения и исследования моделей был сформирован набор данных, состоящий из нескольких тысяч пар. Каждая пара этого набора представляла собой неполный и соответствующий ему полный тексты. Для оценки качества работы моделей осуществлялось вычисление значений функции потерь loss и метрик accuracy, BLEU и ROUGE-L. Loss и accuracy позволили оценить эффективность моделей на уровне предсказания отдельных слов. Метрики BLEU и ROUGE-L использовались для оценки сходства между полными и восстановленными текстами. Полученные результаты показали, что обе модели Encoder-Decoder и Seq2Seq справляются с задачей восстановления текстовых последовательностей из их фиксированного множества, однако модель на основе трансформера Seq2Seq позволяет достичь лучших результатов по скорости и качеству обучения.

Ключевые слова и фразы: модели глубокого обучения, Encoder-Decoder, трансформер Sequence-To-Sequence, восстановление текста, BLEU, ROUGE-L, Keras, Python.

УДК: 004.932.75'1, 004.89
ББК: 32.813.5: 32.973.202-018.2

MSC: Primary 68T20; Secondary 68T07, 68T45

Поступила в редакцию: 03.03.2024
14.04.2024
Подписана в печать : 15.08.2024

Язык публикации: русский и английский

DOI: 10.25209/2079-3316-2024-15-3-75-110



© МИАН, 2025