|
СЕМИНАРЫ |
Большой семинар кафедры теории вероятностей МГУ
|
|||
|
Идентификация значимых факторов с помощью функционала ошибки А. С. Ракитько Московский государственный университет имени М. В. Ломоносова, механико-математический факультет |
|||
Аннотация: Тематика диссертации относится к области алгоритмов выявления значимых факторов, влияющих на случайную функцию отклика. Подобные подходы широко распространены в медико-биологических приложениях (Handbook of Statistical Genomics, 4th Edition (2019)). Оригинальный MDR (multifactorial dimensionality reduction) метод был предложен в работе Ritchie et al. (2001) и получил развитие в ряде работ (Gola et al. (2016)), включая MDR-EFE (multifactorial dimensionality reduction – error function estimation) метод (Булинский и др. (2012)). В диссертации исследуются асимптотические свойства MDR-EFE метода и его модификаций. В первой главе диссертации доказываются теоремы, обосновывающие асимптотическую состоятельность MDR-EFE метода. В случае небинарной функции отклика построена оценка функционала ошибки в MDR-EFE методе по имеющейся выборке с помощью кросс-валидации. Доказан критерий сильной состоятельности построенной оценки. Доказана теорема, обосновывающая возможность использования оценок функционала ошибки для выбора наборов значимых факторов. Получены достаточные условия сильной состоятельности оценок функционала ошибки в случае абсолютно-непрерывно распределенных объясняющих переменных (факторов). Вторая глава диссертации посвящена изучению скорости сходимости предлагаем оценок. Доказана центральная предельная теорема для регуляризованных версий оценок функционала ошибки в случае функции отклика, принимающей конечный набор значений. С помощью техники перестановочных случайных величин доказан новый вариант центральной предельной теоремы для оценок функционала ошибки в MDR-EFE методе. В третьей главе диссертации разрабатывается вариант MDR-EFE метода с последовательным отбором переменных. В случае модели наивного байесовского классификатора получены оценки снизу для вероятности выбора значимого набора факторов MDR-EFE методом с последовательным отбором переменных. Теоретические результаты дополнены компьютерными симуляциями. |