RUS  ENG
Полная версия
ЖУРНАЛЫ // Препринты Института прикладной математики им. М. В. Келдыша РАН // Архив

Препринты ИПМ им. М. В. Келдыша, 2022, 067, 18 стр. (Mi ipmp3092)

Анализ влияния предобработки текстов на идентификацию авторов методом биграмм

М. Ю. Кислицына


Аннотация: На примере достаточно представительного корпуса авторов и текстов проведен сравнительный анализ влияния программ предобработки текстов на возможность идентификации авторов. Исследован вопрос чувствительности ошибки идентификации по доле изменения исходного текста. Показано, что авторское своеобразие сохраняется после предобработки практически на уровне оригинального текста.

Ключевые слова: машинная классификация, предобработка текстов, распределение биграмм, идентификация автора.

DOI: 10.20948/prepr-2022-67



© МИАН, 2024