RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2021, том 15, выпуск 3, страницы 83–90 (Mi ia747)

Эта публикация цитируется в 5 статьях

Формы представления нового знания, извлеченного из текстов

И. М. Зацман

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Рассматривается модель целенаправленного извлечения нового знания из текстов коллективом экспертов, а также формы его представления в лингвистических типологиях и словарях терминов баз медицинских знаний. Использование модели иллюстрируется двумя примерами: извлечение нового знания о значениях немецких модальных глаголов из параллельных текстов и о значениях терминов из медицинских документов. Процесс извлечения нового знания основан на лингвистическом аннотировании текстов экспертами. Основная цель аннотирования состоит в пополнении типологий рубриками (баз знаний (БЗ) — терминами), которые удовлетворяют заданному критерию новизны, согласованы в коллективе экспертов и представляют извлеченное знание. Рассматриваемая модель включает этап согласования понимания экспертами как извлеченного знания, так и форм его представления. В рассматриваемом примере базы знаний используются три формы: новый термин, измененная дефиниция уже существующего термина (без увеличения числа его значений) и расширенная дефиниция уже существующего термина (с увеличением числа его значений).

Ключевые слова: извлечение знания из текстов, модель ИТО, концепт, рубрика, термин, контекстное значение, немецкие модальные глаголы, типология, база медицинских знаний.

Поступила в редакцию: 14.07.2021

DOI: 10.14357/19922264210311



© МИАН, 2024