RUS  ENG
Полная версия
ЖУРНАЛЫ // Искусственный интеллект и принятие решений // Архив

Искусственный интеллект и принятие решений, 2017, выпуск 1, страницы 10–20 (Mi iipr232)

Обработка естественного языка

Метод автоматического выявления неявно выраженных заимствований в научно-технических текстах

В. Н. Захаров, А. А. Хорошилов, А. А. Хорошилов

Федеральный исследовательский центр «Информатика и управление» Российской академии наук, г. Москва

Аннотация: В работе рассматривается процесс автоматического выявления неявно выраженных заимствований в текстах документов, основанный на сопоставлении их формализованных представлений и вычислении мер локальной смысловой схожести понятий и глобальной смысловой схожести фрагментов текстов. При решении данной задачи была разработана модель представления смысловой структуры текстов и методы формализации и установления смысловой близости между фрагментами сравниваемых текстов, а также методы выявления схожих по смысловой структуре фрагментов текстов. Основным преимуществом данного метода является то, что он позволяет эффективно выявить различного рода заимствования, включая самые сложные случаи – неявно выраженные заимствования. В ходе исследования результаты работы метода были сопоставлены с результатами, полученными с применением метода “шинглов”.

Ключевые слова: выявление заимствований, автоматизированная обработка текстов, формализованное описание текста, смысловая структура, лингвистическое программное обеспечение, декларативные средства.



Реферативные базы данных:


© МИАН, 2024