Аннотация:
Рассматривается основные компоненты семантико-ориентированного лингвистического процессора, который извлекает знания (объекты и их связи) из текстов естественного языка. В результате формируется база знаний, которая является основой различного вида семантиченских поисков. Для настройки процессора на корпуса текстов в различных предметных словарях предлагается использовать тематические каталоги и специальную методику организации лингвистических знаний. Для обеспечения необходимой полноты и точности поиска объектов вводятся настроечные таблицы, отражающие значимость компонент, из которых составляются объекты.