RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2010, том 4, выпуск 1, страницы 12–17 (Mi ia13)

Эта публикация цитируется в 4 статьях

Приближения для статистик, описывающих геометрические свойства данных большой размерности, с оценками ошибок

Ю. Кавагучиa, В. В. Ульяновb, Я. Фуджикошиa

a Высшая научная и инженерная школа, Университет Чуо, Токио
b Московский государственный университет им. М. В. Ломоносова, факультет вычислительной математики и кибернетики

Аннотация: При описании геометрических свойств $n$ наблюдений с $p$ признаками необходимо исследовать асимптотическое поведение трех статистик: длины $p$-мерного вектора наблюдений, расстояния между двумя векторами наблюдений и угла между ними. В [1] найдено асимптотическое поведение указанных статистик, когда размерность $p$ стремится к бесконечности, а объем выборки $n$ остается постоянным. В настоящей работе результаты [1] уточняются путем построения асимптотических разложений. Кроме этого, найдены вычислимые оценки погрешности приближения предельными распределениями для первых двух статистик. Эти результаты будут также полезны в ситуациях, когда размерность данных не является чрезмерно большой.

Ключевые слова: данные большой размерности; асимптотические разложения; оценки погрешности; геометрические свойства.



© МИАН, 2024