Аннотация:
Рассматривается модель целенаправленного извлечения нового знания из текстов коллективом экспертов, а также формы его представления в лингвистических типологиях и словарях терминов баз медицинских знаний. Использование модели иллюстрируется двумя примерами: извлечение нового знания о значениях немецких модальных глаголов из параллельных текстов и о значениях терминов из медицинских документов. Процесс извлечения нового знания основан на лингвистическом аннотировании текстов экспертами. Основная цель аннотирования состоит в пополнении типологий рубриками (баз знаний (БЗ) — терминами), которые удовлетворяют заданному критерию новизны, согласованы в коллективе экспертов и представляют извлеченное знание. Рассматриваемая модель включает этап согласования понимания экспертами как извлеченного знания, так и форм его представления. В рассматриваемом примере базы знаний используются три формы: новый термин, измененная дефиниция уже существующего термина (без увеличения числа его значений) и расширенная дефиниция уже существующего термина (с увеличением числа его значений).
Ключевые слова:извлечение знания из текстов, модель ИТО, концепт, рубрика, термин, контекстное значение, немецкие модальные глаголы, типология, база медицинских знаний.