М. Ю. Михеев, Н. В. Сомин, И. В. Галина, О. В. Золотарев, Е. Б. Козеренко, Ю. И. Морозова, М. М. Шарнин, “Фальштексты: классификация и методы опознания текстовых имитаций и документов с подменой авторства”, Информ. и её примен., 2014, том 8, выпуск 4,страницы 70

Эта публикация цитируется в 2 статьях

Фальштексты: классификация и методы опознания текстовых имитаций и документов с подменой авторства

М. Ю. Михеев^ab, Н. В. Сомин^a, И. В. Галина^a, О. В. Золотарев^c, Е. Б. Козеренко^a, Ю. И. Морозова^a, М. М. Шарнин^a

^a Институт проблем информатики Российской академии наук
^b Научно-исследовательский вычислительный центр Московского государственного университета им. М.В. Ломоносова
^c Российский новый университет

Аннотация: Современное текстовое пространство, включая Интернет, огромно и постоянно пополняется новыми текстами. Все текстовые документы можно разбить на две большие группы: «добросовестные тексты» и то, что можно назвать «фальштекстами». К настоящему времени индустрия фальштекстов приобрела столь массовое распространение, что возникает настоятельная потребность изучения этого явления и разработки действенных методов обнаружения подобных текстовых документов. Цель настоящей статьи состоит в том, чтобы дать адекватное описание понятия фальштекста как информационного и лингвистического феномена и предложить некоторые подходы к опознанию таких текстов.

Ключевые слова: порождение текста; обработка естественного языка; статистический анализ языковых объектов; плагиат; типология фальштекстов.

Поступила в редакцию: 01.11.2014

DOI: 10.14357/19922264140409