RUS  ENG
Полная версия
СЕМИНАРЫ

Большой семинар кафедры теории вероятностей МГУ
30 октября 2019 г. 16:45, г. Москва, ГЗ МГУ, ауд. 12-24


Вероятностные методы отбора значимых факторов

А. Кожевин

Московский государственный университет имени М. В. Ломоносова

Аннотация: Диссертация посвящена исследованию некоторых методов отбора значимых признаков, влияющих на изучаемый случайный отклик. Данное направление представляет не только теоретический интерес, но также имеет разнообразные приложения, см., например, монографии Buhlmann, van de Geer (2011), Bolon-Canedo, Alonso-Betanoz (2018). В главе 1 представлена модификация MDR метода, предложенного Ritchie et al. (2001) и развитого в работах Velez et al. (2007), Gui et al. (2011), Булинского (2012), Gola et al. (2015) и ряда других авторов. Основное внимание в диссертации уделяется анализу стратифицированных выборок. Для построенных оценок используемого функционала ошибки доказана их сильная состоятельность. В главах 2 и 3 развиваются информационные подходы к идентификации значимых факторов, см, например, Bennasar et al. (2014), Vergara, Estevez (2014). Для этого во второй главе рассматривается новая оценка условной энтропии в смешанной модели (охватывающей, в частности, логистическую регрессию), когда вектор объясняющих переменных имеет абсолютно непрерывное распределение, а переменная отклика является дискретной случайной величиной. Для предложенной оценки доказана ее асимптотическая несмещенность и $L^2$-состоятельность при весьма широких условиях. В главе 3 также построена оценка совместной информации в смешанной модели. Для нее доказаны асимптотическая несмещенность и $L^2$-состоятельность. Кроме того, доказана теорема о состоятельности процедуры отбора значимых признаков, основанной на введенной оценке совместной информации при условии, что число значимых факторов известно. Доказательства используют аппарат условных математических ожиданий, вероятностные неравенства, оценки скорости сходимости в центральной предельной теореме и другую технику. Теоретические результаты дополнены компьютерными симуляциями. Проведено сопоставление с недавними работами Coelho et al. (2016), Gao et al. (2017), Macedo et al. (2019). Диссертация имеет объем 118 страниц, список литературы содержит более 100 наименований.


© МИАН, 2024