RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2021, том 33, выпуск 4, страницы 99–116 (Mi tisp616)

Синтаксический анализ текстов предметной области при помощи онтологии

Б. И. Гельцерa, Т. А. Горбачb, В. В. Грибоваb, О. В. Карпикc, Э. С. Клышинскийd, Н. А. Кочетковаd, Д. Б. Окуньb, М. В. Петряеваb, К. И. Шахгельдянe

a Дальневосточный Федеральный университет
b Институт автоматики и процессов управления ДВО РАН
c Институт прикладной математики им. М.В. Келдыша РАН
d Национальный исследовательский университет «Высшая школа экономики»
e Владивостокский государственный университет экономики и сервиса

Аннотация: В работе проводится сравнение трех методов синтаксического анализа текстов жалоб пациентов, извлеченных из электронных медицинских карт. В качестве контрольного теста используются существующие библиотеки синтаксического анализа текста. В качестве альтернативы предлагается использование онтологии для исправления ошибок, допущенных синтаксическим анализатором, либо полное формирование синтаксических зависимостей по данным, хранимым в онтологии. В статье показано что ограниченный набор правил, описывающих управление падежами зависимых слов, может показывать точность, сопоставимую с точностью современных синтаксических анализаторов, основанных на нейронных сетях.

Ключевые слова: синтаксический анализ, поверхностно-синтаксический анализ, онтологии, медицинские тексты.

DOI: 10.15514/ISPRAS-2021-33(4)-8



© МИАН, 2024