Аннотация:
Рассмотрены варианты применения методов статистики и машинного обучения для анализа данных, описывающих учебный процесс. Показано решение двух задач, возникающих в образовательном процессе, отличающихся условиями его организации. В первой задаче проанализированы результаты тестирования студентов, изучающих русский язык как иностранный с целью поступления в российский вуз. Они позволяют оценить адекватность методики преподавания, в частности соответствие результатов промежуточных тестов, полученных за итоговый тест. Данные приведены к нормальному виду, проведен дисперсионный анализ и построена кластеризация, которая показывает, что студенты, успешно справляющиеся с промежуточным тестированием, с высокой вероятностью сдадут тест первого сертификационного уровня. Во второй задаче проанализированы результаты обучения младших школьников математике: по промежуточным оценкам (оценки за ответ на уроке) построен классификатор, который определяет оценку за итоговую контрольную работу. Предсказательной моделью служит ансамбль случайных лесов, обученных на четырех выборках: первая — разреженная матрица оценок, остальные являются трансформацией первой ядерным методом главных компонент.
Ключевые слова:статистика, случайный лес, кластеризация, методика преподавания русского языка, методика преподавания математики, анализ образовательной деятельности.