RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2020, том 14, выпуск 1, страницы 113–120 (Mi ia652)

Эта публикация цитируется в 1 статье

Аналитическая текстология в системах интеллектуальной обработки неструктурированных данных

Е. Б. Козеренкоa, М. Ю. Михеевb, Н. В. Соминa, Л. И. Эрлихb, К. И. Кузнецовa

a Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
b Научно-исследовательский вычислительный центр Московского государственного университета им. М. В. Ломоносова

Аннотация: Представлено новое направление исследований на пересечении лингвистики, информатики и филологии с привлечением логико-статистических методов анализа неструктурированных данных в виде естественно-языковых текстов с целью решения целого ряда задач извлечения эксплицитных и имплицитных знаний из текстов с использованием семантически-ориентированного лингвистического процессора (СОЛП), формирования лексико-статистических представлений текстов, построения аналитических заключений, определения идиостиля автора и текстуального сходства произведений на основе анализа служебных слов и других микротекстовых элементов; выявления эмоциональной окрашенности текстов, построения полного профиля авторского текста на основе суперпозиции методов. Рассматривается пример текстологического анализа «Синей книги» из «Петербургского дневника» З. Н. Гиппиус.

Ключевые слова: обработка естественного языка, статистические методы, когнитивные технологии, лексико-семантический анализ, извлечение знаний из текстов, аналитические системы.

Поступила в редакцию: 15.01.2020

DOI: 10.14357/19922264200115



© МИАН, 2024