Аннотация:
В статье представлена система, которая извлекает симптомы заболеваний из медицинских клинических записей (текстов на естественном русском языке) и автоматически предсказывает по ним диагноз в виде наименования заболевания и его кода в соответствии со справочником МКБ-10. Система ограничена предметной областью из 6 пульмонологических заболеваний (хроническая обструктивная болезнь легких, пневмония, бронхиальная астма и др.) и COVID-19.
Извлечение симптомов реализовано с помощью нескольких нейронных сетей, выделяющих отдельные медицинские сущности и связи между ними. Предсказание диагноза также реализовано в виде классификатора на основе нейронной сети. Для обучения извлечению симптомов создан аннотированный корпус предложений. Описаны принципы и правила разметки симптомов. Представлен корпус текстов для обучения классификатора предсказанию диагнозов.
Приведены оценки точности при тестировании обеих подсистем. Точность предсказания диагноза на данной предметной области составила 88,5%. Даны сравнения с аналогичными работами по извлечению симптомов из текстов на различных языках, а также по автоматическому предсказанию диагнозов, включая системы типа ChatGPT.
Ключевые слова и фразы:
системы поддержки принятия врачебных решений, извлечение симптомов, автоматическое предсказание диагнозов, BERT-модели, системы на основе ChatGPT.