Two Lempel – Ziv goodness-of-fit tests for nonequiprobable random binary sequences
[Два критерия Лемпеля – Зива для неравновероятных случайных двоичных последовательностей]
V. I. Kruglov Steklov Mathematical Institute of Russian Academy of Sciences, Moscow
Аннотация:
Пусть гипотеза
$H_p$ состоит в том, что элементы последовательности
$X_1,\ldots,X_n$ независимы и имеют одинаковое распределение:
$\mathbf{P}\{X_i=1\}=p$,
$\mathbf{P}\{X_i=0\}=1-p$, где
$p\in(0,1)$. Ранее были предложены два критерия согласия для гипотезы
$H_{0.5}$, основанные на возможности точного вычисления распределений статистик Лемпеля – Зива. В данной статье эти критерии обобщаются на случай произвольных
$p\in(0,1)$. Для каждого критерия последовательность длины
$n=mrT$ делится на блоки длины
$T$, для которых строятся статистики Лемпеля – Зива
$W_1(T),\ldots, W_{mr}(T)$. Первый критерий при
$r=2$ основан на статистике $\tilde W(2mT)=(W_1+\ldots+W_m)-(W_{m+1}+\ldots+W_{2m})$, распределение которой симметрично относительно нуля. Статистикой второго критерия является величина $\tilde \chi^2(mrT)=\max_{1\le k\le m} \chi_{(k)}^2(T)$, где
$\chi_{(1)}^2(T),\ldots,\chi_{(m)}^2(T)$ — значения статистик хи-квадрат, построенных по наборам $(W_{1,1}(T),\ldots, W_{1,r}(T)),\ldots,(W_{m,1}(T), W_{m,2}(T), \ldots, W_{m,r}(T))$ соответственно. Для статистик обоих критериев найдены предельные распределения, для статистики первого критерия приведена оценка скорости сходимости к предельному нормальному распределению.
Ключевые слова:
критерий Лемпеля – Зива, тестирование генераторов случайных чисел, статистические критерии, вычисление распределений.
УДК:
519.233.3 Получено 02.IX.2022
Язык публикации: английский
DOI:
10.4213/mvk440