Аннотация:
Одной из основных проблем статистического анализа экспериментальных данных является получение несмещенных (репрезентативных) выборочных совокупностей. Вполне естественным является желание получить репрезентативную выборку вычислительными методами. Процедура приведения структуры выборки в соответствие со структурой генеральной совокупности называется «корректировкой выборки». Все известные методы корректировки выборочных данных обладают существенным недостатком: они «исправляют» эмпирические функции распределения, а не сами выборочные совокупности. В предлагаемой статье вводятся понятия пространств контрольных и изучаемых признаков, дается формальное определение репрезентативной выборочной совокупности, рассматривается рандомизированный алгоритм корректировки именно выборочных данных, а не их эмпирических распределений. Итерации рандомизированного алгоритма корректировки выборочных данных можно описать следующим образом. Сначала выбирается спектральное значение одного из контрольных признаков такое, что модуль разности между соответствующими выборочной и генеральной долями имеет максимальное значение, т. е. по всем $k$ таким, что $1\le k\le n$, ищется $\max|w_k-p_k|$. Если таких спектральных значений несколько, то случайным образом выбирается любое из них. Пусть это будет $i$-я компонента векторов $\mathbf{W}^{X}$ и $\mathbf{P}^{X}$. Затем, если $w_i-p_i>0$, из выборочной совокупности случайным образом удаляется некоторый вектор $\mathbf{Z_t}$, в котором компонента $x_i=1$; если же $w_i-p_i<0$, то в выборочной совокупности случайным образом дублируется вектор $\mathbf{Z_t}$, в котором компонента $x_i=1$. Библиогр. 9 назв.