Аннотация:
Представлены модели текстовых коллекций, формируемые на базе матричной модели текстов на естественных языках. В качестве методов формирования моделей коллекций рассмотрены способы вычислительного выявления тематической структуры текстовых коллекций. Предложено использование моделей для поиска тематически сходных текстовых коллекций и тематической категоризации текстов на основании моделей текстов и текстовых коллекций. Проанализированы отличия предложенных моделей текстовых коллекций от распространенных подходов к их анализу и моделированию.
Ключевые слова:тексты на естественных языках, текстовые коллекции, модели текстовых коллекций, тематические модели, модели текстов, поиск и анализ информации.
Поступила в редакцию: 16.05.2019 Исправленный вариант: 16.05.2019 Принята в печать: 01.07.2019