Аннотация:
Изучение сложных явлений вовлекает данные высоких размерностей. Это типично для многих медицинских и биологических исследований, особенно в генетике и фармакологии. Мы изучаем бинарный отклик (показывающий, например, состояние здоровья пациента), зависящий от $n$ дискретных факторов (объясняющих переменных). Очень важной проблемой является нахождение среди них наиболее значимых. Цель работы – установить необходимые и достаточные условия сильной состоятельности определенных оценок, использующих кросс-валидацию, для ошибки, возникающей в алгоритме предсказания величины отклика. Также обсуждается влияние выбора штрафной функции. Полученные результаты дают обоснование для хорошо известного MDR-метода, который широко применяется при анализе генетических данных. Библ. – 15 назв.
Ключевые слова:бинарный отклик, значимые факторы, штрафная функция, кросс-валидация, MDR метод, усиленный закон больших чисел для массивов, сильная состоятельность оценок.