RUS  ENG
Полная версия
СЕМИНАРЫ

Большой семинар кафедры теории вероятностей МГУ
13 ноября 2019 г. 16:45, г. Москва, ГЗ МГУ, ауд. 12-24


Идентификация значимых факторов с помощью функционала ошибки

А. С. Ракитько

Московский государственный университет имени М. В. Ломоносова, механико-математический факультет

Аннотация: Тематика диссертации относится к области алгоритмов выявления значимых факторов, влияющих на случайную функцию отклика. Подобные подходы широко распространены в медико-биологических приложениях (Handbook of Statistical Genomics, 4th Edition (2019)). Оригинальный MDR (multifactorial dimensionality reduction) метод был предложен в работе Ritchie et al. (2001) и получил развитие в ряде работ (Gola et al. (2016)), включая MDR-EFE (multifactorial dimensionality reduction – error function estimation) метод (Булинский и др. (2012)). В диссертации исследуются асимптотические свойства MDR-EFE метода и его модификаций.
В первой главе диссертации доказываются теоремы, обосновывающие асимптотическую состоятельность MDR-EFE метода. В случае небинарной функции отклика построена оценка функционала ошибки в MDR-EFE методе по имеющейся выборке с помощью кросс-валидации. Доказан критерий сильной состоятельности построенной оценки. Доказана теорема, обосновывающая возможность использования оценок функционала ошибки для выбора наборов значимых факторов. Получены достаточные условия сильной состоятельности оценок функционала ошибки в случае абсолютно-непрерывно распределенных объясняющих переменных (факторов).
Вторая глава диссертации посвящена изучению скорости сходимости предлагаем оценок. Доказана центральная предельная теорема для регуляризованных версий оценок функционала ошибки в случае функции отклика, принимающей конечный набор значений. С помощью техники перестановочных случайных величин доказан новый вариант центральной предельной теоремы для оценок функционала ошибки в MDR-EFE методе.
В третьей главе диссертации разрабатывается вариант MDR-EFE метода с последовательным отбором переменных. В случае модели наивного байесовского классификатора получены оценки снизу для вероятности выбора значимого набора факторов MDR-EFE методом с последовательным отбором переменных. Теоретические результаты дополнены компьютерными симуляциями.


© МИАН, 2024