RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления // Архив

Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр., 2015, выпуск 3, страницы 96–104 (Mi vspui259)

Информатика

Рандомизированный алгоритм корректировки выборочных данных

А. В. Орехов

Санкт-Петербургский государственный университет, Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7/9

Аннотация: Одной из основных проблем статистического анализа экспериментальных данных является получение несмещенных (репрезентативных) выборочных совокупностей. Вполне естественным является желание получить репрезентативную выборку вычислительными методами. Процедура приведения структуры выборки в соответствие со структурой генеральной совокупности называется «корректировкой выборки». Все известные методы корректировки выборочных данных обладают существенным недостатком: они «исправляют» эмпирические функции распределения, а не сами выборочные совокупности. В предлагаемой статье вводятся понятия пространств контрольных и изучаемых признаков, дается формальное определение репрезентативной выборочной совокупности, рассматривается рандомизированный алгоритм корректировки именно выборочных данных, а не их эмпирических распределений. Итерации рандомизированного алгоритма корректировки выборочных данных можно описать следующим образом. Сначала выбирается спектральное значение одного из контрольных признаков такое, что модуль разности между соответствующими выборочной и генеральной долями имеет максимальное значение, т. е.  по всем $k$ таким, что $1\le k\le n$, ищется $\max|w_k-p_k|$. Если таких спектральных значений несколько, то случайным образом выбирается любое из них. Пусть это будет $i$-я компонента векторов $\mathbf{W}^{X}$ и $\mathbf{P}^{X}$. Затем, если $w_i-p_i>0$, из выборочной совокупности случайным образом удаляется некоторый вектор $\mathbf{Z_t}$, в котором компонента $x_i=1$;  если же $w_i-p_i<0$, то в выборочной совокупности случайным образом дублируется вектор $\mathbf{Z_t}$, в котором компонента $x_i=1$. Библиогр. 9 назв.

Ключевые слова: рандомизированный алгоритм, выборочная совокупность.

УДК: 519.253+519.712

Поступила: 30 апреля 2015 г.



Реферативные базы данных:


© МИАН, 2024