RUS  ENG
Полная версия
ЖУРНАЛЫ // Дискретная математика // Архив

Дискрет. матем., 1993, том 5, выпуск 3, страницы 44–63 (Mi dm690)

Задача различения гипотез о параметрах процесса обобщенного скользящего суммирования

Г. В. Проскурин


Аннотация: Рассматривается процесс $\chi_t=L(\chi_t^1,\chi_{t+1}^1,\dots,\chi_{t+n_1-1}^1,\dots,\chi_t^r,\dots,\chi_{t+n_r-1} ^r)$, $t=1,\dots,T$, где $\chi_{\tau}^i$ – в совокупности независимые, одинаково распределенные случайные величины, принимающие значения в поле из двух элементов $GF(2)$; $P\{\chi_\tau^i=0\}=(1+\theta)/2$; $L$ – линейная булева функция. Доказана логарифмическая нормальность предельного распределения статистики отношения правдоподобия для различения по наблюдаемой последовательности $\chi_t$ двух простых гипотез $\theta=\delta>0$ и $\theta=0$ при $\delta\to0$. Предложены алгоритмы вычисления параметров функции $L$, определяющих объем материала $T$ необходимого для различения гипотез с ошибками, стремящимися к нулю. Показано, что при $r\geqslant2$, $\sum_{i=1}^rn_i\to\infty$ и оптимальном выборе функции $L$ указанный материал имеет порядок не меньше, чем $\delta^{2k(L)}$, где $k(L)=O(n/\ln n)$ – определяется видом функции $L$.
Под процессом обобщенного скользящего суммирования будем понимать процесс
$$ \chi_t=L(\chi_t^1,\chi_{t+1}^1,\dots,\chi_{t+n_1-1},\dots,\chi_t^r,\dots,\chi_{t+n_r-1}^r), \qquad t=1,\dots,T, $$
где $\chi_\tau^i$ – в совокупности независимые, одинаково распределенные случайные величины, принимающие значения в поле из двух элементов $GF(2)$; $P\{\chi_\tau^i=0\}=(1+\theta)/2$, $L$ – линейная булева функция, $L(0,0,\dots,0)=0$. При $r=1$
$$ L(z_t^1,z_{t+1}^1,\dots,z_{i+n_1-1}^1)=z_t^1+z_{t+1}^1+\dots+z_{t+n_1-1}^1 \pmod2, $$
и следовательно, когда $L$ существенно зависит от всех переменных, процесс $\chi_t$ превращается в обычный процесс скользящего суммирования в поле $GF(2)$; что объясняет используемое название “процесс обобщенного скользящего суммирования”.
Основное содержание статьи составит исследование следующего круга вопросов, возникающих, в частности, при разработке и изучении датчиков случайных чисел. Наблюдается реализация процесса $\chi_t$, $t=1,\dots,T$. Требуется построить статистику оптимального критерия для различения гипотез $\theta=\delta>0$ и $\theta=0$ о параметре $\theta$; исследовать асимптотическое поведение этой статистики при $\delta\to0$; выявить параметры, определяющие эффективность критерия, и предложить способы их расчета; оценить объем выборки $T$, необходимый для различения гипотез с заданными ошибками, изучить зависимость объема от функции $L$ а также выявить функции, при которых гипотезы различаются наиболее слабо.
Заметим, что для различения сформулированных гипотез могут быть использованы достаточно естественные статистики
$$ \chi(F)=\chi(f_1,f_2,\dots,f_d)=\sum_{t=1}^T(\chi_{t+f_1}+\oplus\chi_{t+f_2}\oplus\dotsb\oplus\chi_{t+f_d}), $$
зависящие от множества параметров $F=\{f_1,f_2,\dots,f_d\}$. (Здесь и ниже для суммирования в поле $GF(2)$ используются обозначения $\oplus$ и $\Sigma\oplus$.) Для таких статистик, как нетрудно проследить, эффективность различения гипотез определяется числом $k_F(L)$ членов после приведения подобных в функциях
$$ L_F=\sum_{f\in F}\oplus L(z_{t+f}^1,z_{t+f+1}^1,\dots,z_{t+f+n_1-1}^r,\dots,z_{t+f+n_r-1}^r) $$
Ниже будет показано, что для оптимальной статистической процедуры аналогичную роль играет величина $k(L)=\min\{k_F(L):F\ne0\}$.
Статья имеет следующую структуру. В § 1 вынесен ряд вспомогательных результатов, в § 2 приводятся алгоритмы вычисления величины $K(L)$ для заданной функции $L$, а также получены двусторонние оценки этой величины для всех $L$ , таких что $\sum_{i=1}^{r}n_i=n$. В § 3 доказан ряд предельных теорем об асимптотическом поведении статистики отношения правдоподобия.

УДК: 519.2

Статья поступила: 27.10.1992


 Англоязычная версия: Discrete Mathematics and Applications, 1993, 3:5, 483–503

Реферативные базы данных:


© МИАН, 2024