RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2014, том 8, выпуск 4, страницы 70–77 (Mi ia345)

Эта публикация цитируется в 2 статьях

Фальштексты: классификация и методы опознания текстовых имитаций и документов с подменой авторства

М. Ю. Михеевab, Н. В. Соминa, И. В. Галинаa, О. В. Золотаревc, Е. Б. Козеренкоa, Ю. И. Морозоваa, М. М. Шарнинa

a Институт проблем информатики Российской академии наук
b Научно-исследовательский вычислительный центр Московского государственного университета им. М.В. Ломоносова
c Российский новый университет

Аннотация: Современное текстовое пространство, включая Интернет, огромно и постоянно пополняется новыми текстами. Все текстовые документы можно разбить на две большие группы: «добросовестные тексты» и то, что можно назвать «фальштекстами». К настоящему времени индустрия фальштекстов приобрела столь массовое распространение, что возникает настоятельная потребность изучения этого явления и разработки действенных методов обнаружения подобных текстовых документов. Цель настоящей статьи состоит в том, чтобы дать адекватное описание понятия фальштекста как информационного и лингвистического феномена и предложить некоторые подходы к опознанию таких текстов.

Ключевые слова: порождение текста; обработка естественного языка; статистический анализ языковых объектов; плагиат; типология фальштекстов.

Поступила в редакцию: 01.11.2014

DOI: 10.14357/19922264140409



Реферативные базы данных:


© МИАН, 2024