Задача различения гипотез о параметрах процесса обобщенного скользящего суммирования
Г. В. Проскурин
Аннотация:
Рассматривается процесс
$\chi_t=L(\chi_t^1,\chi_{t+1}^1,\dots,\chi_{t+n_1-1}^1,\dots,\chi_t^r,\dots,\chi_{t+n_r-1}
^r)$,
$t=1,\dots,T$, где
$\chi_{\tau}^i$ – в совокупности независимые, одинаково распределенные случайные величины, принимающие значения в поле из двух элементов
$GF(2)$;
$P\{\chi_\tau^i=0\}=(1+\theta)/2$;
$L$ – линейная булева функция. Доказана логарифмическая нормальность предельного распределения статистики отношения правдоподобия для различения по наблюдаемой последовательности
$\chi_t$ двух простых гипотез
$\theta=\delta>0$ и
$\theta=0$ при
$\delta\to0$. Предложены алгоритмы вычисления параметров функции
$L$, определяющих объем материала
$T$ необходимого для различения гипотез с ошибками, стремящимися к нулю. Показано, что при
$r\geqslant2$,
$\sum_{i=1}^rn_i\to\infty$ и оптимальном выборе функции
$L$ указанный материал имеет порядок не меньше, чем
$\delta^{2k(L)}$, где
$k(L)=O(n/\ln n)$ – определяется видом функции
$L$.
Под процессом обобщенного скользящего суммирования будем понимать процесс
$$
\chi_t=L(\chi_t^1,\chi_{t+1}^1,\dots,\chi_{t+n_1-1},\dots,\chi_t^r,\dots,\chi_{t+n_r-1}^r), \qquad t=1,\dots,T,
$$
где
$\chi_\tau^i$ – в совокупности независимые, одинаково распределенные случайные
величины, принимающие значения в поле из двух элементов
$GF(2)$;
$P\{\chi_\tau^i=0\}=(1+\theta)/2$,
$L$ – линейная булева функция,
$L(0,0,\dots,0)=0$. При
$r=1$
$$
L(z_t^1,z_{t+1}^1,\dots,z_{i+n_1-1}^1)=z_t^1+z_{t+1}^1+\dots+z_{t+n_1-1}^1 \pmod2,
$$
и следовательно, когда
$L$ существенно зависит от всех переменных, процесс
$\chi_t$
превращается в обычный процесс скользящего суммирования в поле
$GF(2)$; что
объясняет используемое название “процесс обобщенного скользящего суммирования”.
Основное содержание статьи составит исследование следующего круга вопросов, возникающих, в частности, при разработке и изучении датчиков случайных чисел. Наблюдается реализация процесса
$\chi_t$,
$t=1,\dots,T$. Требуется построить статистику оптимального критерия для различения гипотез
$\theta=\delta>0$ и
$\theta=0$ о параметре
$\theta$; исследовать асимптотическое поведение этой статистики при
$\delta\to0$; выявить параметры, определяющие эффективность критерия, и предложить способы их расчета; оценить объем выборки
$T$, необходимый для различения гипотез с заданными ошибками, изучить зависимость объема от функции
$L$ а также выявить функции, при которых гипотезы различаются наиболее слабо.
Заметим, что для различения сформулированных гипотез могут быть использованы достаточно естественные статистики
$$
\chi(F)=\chi(f_1,f_2,\dots,f_d)=\sum_{t=1}^T(\chi_{t+f_1}+\oplus\chi_{t+f_2}\oplus\dotsb\oplus\chi_{t+f_d}),
$$
зависящие от множества параметров
$F=\{f_1,f_2,\dots,f_d\}$. (Здесь и ниже для
суммирования в поле
$GF(2)$ используются обозначения
$\oplus$ и
$\Sigma\oplus$.)
Для таких статистик, как нетрудно проследить, эффективность различения гипотез определяется числом
$k_F(L)$ членов после приведения подобных в функциях
$$
L_F=\sum_{f\in F}\oplus L(z_{t+f}^1,z_{t+f+1}^1,\dots,z_{t+f+n_1-1}^r,\dots,z_{t+f+n_r-1}^r)
$$
Ниже будет показано, что для оптимальной статистической процедуры аналогичную роль играет величина
$k(L)=\min\{k_F(L):F\ne0\}$.
Статья имеет следующую структуру. В § 1 вынесен ряд вспомогательных
результатов, в § 2 приводятся алгоритмы вычисления величины
$K(L)$ для заданной
функции
$L$, а также получены двусторонние оценки этой величины для всех
$L$ , таких что
$\sum_{i=1}^{r}n_i=n$. В § 3 доказан ряд предельных теорем об асимптотическом поведении статистики отношения правдоподобия.
УДК:
519.2 Статья поступила: 27.10.1992