RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2007, выпуск 17, страницы 236–253 (Mi ssi80)

Эта публикация цитируется в 5 статьях

Информационные технологии

Англо-русская система извлечения знаний из потоков информации в Интернет-среде

И. П. Кузнецов, Н. В. Сомин


Аннотация: Рассматриваются лингвистические и алгоритмические аспекты проблемы извлечения знаний из текстов среды Интернет. Предлагаются средства, повышающие качество работы лингвистического процессора и учитывающие особенности документов в Интернете, в том числе, наличие большого количества англоязычных текстов. С этой целью в блок морфологического анализа введены дополнительные средства для выявления формальных и содержательных признаков английских слов. Расширены возможности предметных каталогов в плане выявления семантических категорий английских слов. Разработаны контекстные правила для синтактико-семантического анализа типовых форм английского языка. Предлагаются средства настройки блоков морфологического и синтактико-семантического анализа (через предметные каталоги) на язык входного текста.

УДК: 681.3.81



© МИАН, 2024