RUS  ENG
Полная версия
СЕМИНАРЫ

Стохастический анализ в задачах
9 ноября 2013 г. 11:00, г. Москва, Большой Власьевский переулок, дом 11


Моделирование интернета и ранжирование web-страниц

Е. А. Самосватab, Л. А. Остроумоваab, М. Е. Жуковскийba, Е. Ю. Клочковcb

a Московский физико-технический институт (государственный университет), г. Долгопрудный Московской обл.
b Компания «Яндекс»
c Лаборатория структурных методов анализа данных в предсказательном моделировании при МФТИ (ПреМоЛаб), г. Москва

Аннотация: В докладке Егора Самосвата будет рассказано о применении метода максимального правдоподобия для валидации моделей веб графа, например, для валидации модели предпочтительного присоединения (на основе статьи http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.64.1812&rep=rep1&type=pdf). В указанной статье авторам пришлось усреднять правдоподобие по разным перестановкам вершин, поскольку в данных не было информации о порядке появления вершин, необходимой для подсчета правдоподобия PA модели). Так как перестановок очень много, то авторы использовали MCMC метод. Также планируется рассказ о валидации модели http://arxiv.org/abs/1209.4523 (в данных была информация о временах появления вершин). Ответа на вопросы о возможном количестве скрытых переменных и о том, наблюдается ли переобучение, пока нет, но данные вопросы могут вызвать интересную дискуссию. Также хочется обсудить, имеет ли смысл регуляризовывать MLE метод для моделей веб-графов и можно ли построить теорию переобучения моделей веб-графов.


© МИАН, 2024