Аннотация:
Прогресс в области интеллектуального анализа данных делает возможным использование образовательных данных для повышения качества образовательных процессов. В статье
рассмотрены различные методы анализа данных об успеваемости студентов. Основное внимание
уделено двум аспектам: во-первых, прогнозирование академических достижений студентов в конце
четырехлетней учебной программы по программам бакалавриата; во-вторых, изучение типичных
прогрессий учащихся и объединение их с результатами прогнозирования. При прогнозировании
было использовано порядка 10 алгоритмов классификации. Предложен подход к улучшению производительности методов классификации, когда атрибуты классификаторов выбираются в процессе
их обучения. Определены две важные группы учащихся – с низкими и высокими достижениями.
Результаты показывают, что, сосредоточив внимание на небольшом количестве курсов, которые являются показателями особенно хорошей или плохой успеваемости, можно своевременно предупреждать и поддерживать студентов с низкой успеваемостью, а также давать советы и возможности
студентам с высокой успеваемостью.
Ключевые слова:анализ образовательных данных, дерево решений, кластеризация, прогнозирование, успеваемость, дистилляция.