Аннотация:
В рамках данной статьи проведено аналитическое сравнение популярных языковых моделей для обработки медицинских текстов. Охватываются такие модели, как MedCAT, ScispaCy, BioBERT и разные версии GPT. Оценка выполнена в соответствии с рядом критериев: точность извлечения информации, понимание контекста, универсальность применения, скорость обработки информации, наличие устойчивости к шуму данных и уровень интерпретируемости результатов. По результатам исследования было выявлено, что модель MedCAT обладает наивысшими показателями и в большей степени подходит для применения в медицинских задачах. В исследовании также подчеркивается значимость интеграции популярных языковых моделей в процессы, связанные с обработкой медицинской информации с целью повышения эффективности и качества медицинского обслуживания.