Аннотация:
На примере корпуса отзывов о банковских продуктах и услугах проводится анализ и составление моделей классификации текстов. В работе исследуются разные подходы к обработке неструктурированной текстовой информации. На основе выбранных подходов анализируется корпус отзывов о банковских продуктах и услугах, полученных в период пандемии COVID-19. Разработан автоматический парсер интернет-ресурсов для получения требуемой обучающей выборки. Разработано программное обеспечение, реализующее основные методы для построения моделей классификации. Данная модель может быть использована для создания систем мониторинга отношения населения к процессам в банковской сфере.
Ключевые слова:классификация, анализ данных, контекст документа,
важность слов, лингвистика, машинное обучение.