RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика, телекоммуникации и управление // Архив

Информатика, телекоммуникации и управление, 2022, том 15, выпуск 2, страницы 43–62 (Mi ntitu315)

Моделирование вычислительных, телекоммуникационных, управляющих и социально-экономических систем

Разработка и исследование моделей многоклассовых классификаторов для рекомендательной системы подготовки заявок на портале единой информационной системы в сфере закупок

Я. А. Селиверстовa, А. А. Комиссаровb, А. А. Лесоводскаяb, П. Г. Бовыкинb, А. В. Подтиховb, С. С. Торсионовb, Д. А. Цирковb, С. А. Орловc

a Институт проблем транспорта им. Н.С. Соломенко Российской академии наук
b Университет Национальной технологической инициативы 2035, Москва
c Национальный исследовательский Томский государственный университет

Аннотация: Обоснована актуальность разработки сервисов, способствующих подготовке тендерной документации, в части определения кода ОКПД 2 к формируемой заявке. Для решения задачи автоматической классификации заявок в соответствии с ОКПД 2 разработан алгоритм системы сравнительного анализа моделей классификаторов, осуществлена предобработка и запись в базу данных собранной информации в формате json. Разметка и подготовка данных для обучения моделей классификаторов осуществлена в среде PolyAnalyst. В качестве моделей многоклассовых классификаторов из библиотеки Scikit-Learn выбраны наивный байесовский классификатор, SVM-классификатор и классификатор на основе случайного леса. В качестве векторизаторов выбрана модель tfidf и word-haching. В качестве четвертого классификатора выбрана нейросетевая модель ruBert-base. Проведено обучение классификаторов и оценено качество их работы. По результатам валидации и тестирования лучшими оказались две модели: ruBert-base и модель наивного байесовского классификатора с векторизатором word-hashing. На основе результатов произведена тестовая классификация заявок.

Ключевые слова: рекомендательные системы, многоклассовая классификация, SVM, naive Bayes, ruBert-base, векторизаторы.

УДК: 004.912, 004.85, 004.41

Поступила в редакцию: 25.08.2022

DOI: 10.18721/JCSTCS.15204



© МИАН, 2025