В. Н. Захаров, А. А. Хорошилов, А. А. Хорошилов, “Метод автоматического выявления неявно выраженных заимствований в научно-технических текстах”, Искусственный интеллект и принятие решений, 2017, выпуск 1,страницы 10

Обработка естественного языка

Метод автоматического выявления неявно выраженных заимствований в научно-технических текстах

В. Н. Захаров, А. А. Хорошилов, А. А. Хорошилов

Федеральный исследовательский центр «Информатика и управление» Российской академии наук, г. Москва

Аннотация: В работе рассматривается процесс автоматического выявления неявно выраженных заимствований в текстах документов, основанный на сопоставлении их формализованных представлений и вычислении мер локальной смысловой схожести понятий и глобальной смысловой схожести фрагментов текстов. При решении данной задачи была разработана модель представления смысловой структуры текстов и методы формализации и установления смысловой близости между фрагментами сравниваемых текстов, а также методы выявления схожих по смысловой структуре фрагментов текстов. Основным преимуществом данного метода является то, что он позволяет эффективно выявить различного рода заимствования, включая самые сложные случаи – неявно выраженные заимствования. В ходе исследования результаты работы метода были сопоставлены с результатами, полученными с применением метода “шинглов”.

Ключевые слова: выявление заимствований, автоматизированная обработка текстов, формализованное описание текста, смысловая структура, лингвистическое программное обеспечение, декларативные средства.