|
СЕМИНАРЫ |
Большой семинар кафедры теории вероятностей МГУ
|
|||
|
Эпсилон-сложность непрерывных функций и новая методология сегментации временных рядов Б. С. Дарховскийa, A. Piryatinskab a Институт системного анализа РАН b San Francisco State University |
|||
Аннотация: Анализ длинного временного ряда (в режиме off-line) следует начинать с проверки гипотезы о его «однородности», а именно, надо проверить, не изменялся ли механизм генерации ряда в процессе сбора данных. Если эта гипотеза отвергается, и ряд «склеен» из достаточно длинных кусков, каждый из которых сгенерирован своим собственным механизмом, то для проведения дальнейшего анализа надо найти точки «склейки», т.е., те моменты времени, когда механизм генерации ряда менялся. Без осуществления такой процедуры результаты анализа ряда не могут быть адекватны. В том случае, когда ряд генерируется вероятностными механизмами, описанная задача есть известная задача о «разладке» (в режиме off-line). Однако, далеко не всегда ряд генерируется вероятностными механизмами, но даже если это так, то найти точки «разладки» без априорной информации о модели ряда весьма сложно. Возникает вопрос: нельзя ли найти такую «внутреннюю» характеристику ряда, которая бы не зависела от механизма его генерации и дала бы возможность его сегментации на «однородные» участки? Мы полагаем, что такой характеристикой может служить введенное нами новое понятие – эпсилон-сложность индивидуальной непрерывной функции. Это понятие согласуется с общей идеей А.Н.Колмогорова о том, что такое «сложный» объект. Устанавливается, что для «почти любой» функции, удовлетворяющей условию Гёльдера, эпсилон-сложность допускает простую характеризацию в виде пары действительных чисел (мы их называем коэффициенты сложности). Это обстоятельство позволяет предложить принципиально новую методологию сегментации временных рядов произвольной природы (стохастических, детерминированных или смешанных) без использования какой-либо априорной информации о механизмах генерации. Ключевая гипотеза этой методологии состоит в том, что изменение механизма генерации влечет за собой изменение средних значений коэффициентов сложности, и поэтому нахождение моментов «склейки» сводится к задаче обнаружения «разладок» в среднем значении коэффициентов сложности. Приводятся результаты вычислительных экспериментов, подтверждающие работоспособность предлагаемой методологии. |