Аннотация:
В работе рассматривается процесс автоматического выявления неявно выраженных заимствований в текстах документов, основанный на сопоставлении их формализованных представлений и вычислении мер локальной смысловой схожести понятий и глобальной смысловой схожести фрагментов текстов. При решении данной задачи была разработана модель представления смысловой структуры текстов и методы формализации и установления смысловой близости между фрагментами сравниваемых текстов, а также методы выявления
схожих по смысловой структуре фрагментов текстов. Основным преимуществом данного метода является то, что он позволяет эффективно выявить различного рода заимствования, включая самые сложные случаи – неявно выраженные заимствования. В ходе исследования результаты работы метода были сопоставлены с результатами, полученными с применением метода “шинглов”.