Аннотация:
Решается задача классификации контента электронной обучающей системы (ЭОС), относящегося к блокам задач или практических примеров. Необходимость автоматизированного классификатора обоснована перспективным направлением развития ЭОС — оцениванием качества обучающего контента. Ключевая идея — моделирование контента объектом с двумя свойствами: текстовым описанием на традиционном языке и набором формульных выражений на языке научной компьютерной верстки TeX. На основе электронного учебника по теории функций комплексного переменного выполнено формирование размеченных в соответствии с данной моделью образцов задач. Проведено обучение четырех алгоритмов классификации текстового контента — наивного байесовского классификатора, логистической регрессии, однослойной и многослойной нейронных сетей прямого распространения. Проведен комплекс сравнительных экспериментов на реализованных классификаторах как в условиях ограниченных моделей, содержащих только контент одного типа, текстовый или формульный, так и полной модели. В результате эксперимента выполнено не только формальное сравнение алгоритмов, но и показано принципиальное преимущество полной модели: при учете обоих свойств контента, текстового и формульного, качество классификации существенно превосходит однофакторные алгоритмы и обеспечивает показатели, подтверждающие готовность технологии к практическому применению.
Ключевые слова:электронная обучающая система, обучающий контент, задача и алгоритмы классификации, оценка качества контента, машинное обучение.