Аннотация:
Предложен эффективный метод поиска тематически похожих документов. Показана его применимость для решения задач эксплоративного патентного поиска. Метод позволяет снизить трудоемкость и повысить качество решения аналитических задач, связанных с патентным поиском и анализом. В качестве признаков для представления текстовых документов используются как отдельные лексемы, так и словосочетания, выделяемые синтаксически. Это позволяет решить проблему экспоненциального роста размерности признакового пространства и дает возможность эффективной индексации больших массивов текстовой информации. Представлены результаты экспериментов по решению одной из задач экспертизы заявок на изобретения и полезные модели. Сделаны выводы о перспективности использования метода при решении других задач.