Аннотация:
Предложены методы статистического анализа данных, собираемых в обзорных обследованиях. Предложенный подход общий и применим в большинстве случаев, когда в собранных данных содержатся интервалы. Такие данные типичны во многих исследованиях: в анализе надежности изделий и систем, продолжительности жизни в демографии, в медицине и экономике, в обзорных обследованиях мнения населения и др. Имеются серьезные причины для интенсивного использования данных с интервалами. Наиболее общей причиной является невозможность наблюдения точных значений. Природа исследуемых интервалов необычна. Так называемые самовыбираемые интервалы без каких-либо ограничений свободно выбираются субьектами обследований. Концы таких интервалов могут быть округлены. Предлагается обобщение продуктивного подхода к статистическому анализу в общей схеме цензурирования, предложенной Б. В. Турнбуллом. Объяснено и обобщено основное условие независимости в анализе Турнбулла. Предложено правило остановки выборочного процесса на основе достигнутого значения вероятности покрытия. Введение дополнительного (второго) вопроса всем выбранным респондентам дает возможность получения более точной оценки характеристик искомого распределения. Дано обоснование методов информатики, применяемых для анализа статистических данных, содержащих самовыбираемые интервалы. Эти методы дают возможность частичной идентификации искомых непараметрических распределений. Дано описание статистических моделей данных, допускающих зависимость выбора интервалов от положения в них точных значений. Получены рекурсии быстрого вычисления оценок максимального правдоподобия для характеристик искомых распределений. Приведены результаты применения предлагаемых методов, подтверждающие их полезность в анализе смоделированных данных, содержащих самовыбираемые интервалы.