Аннотация:
Изучается величина ошибки идентификации выборочного распределения многомерной дискретной случайной величины среди библиотеки эталонных генеральных совокупностей в зависимости от размерности случайного вектора, длины выборки и расстояния между двумя эталонными распределениями в нормах C и L1. Показано, что ошибка распознавания в норме L1 существенно ниже, чем в C. В качестве практического применения рассмотрены эталонные распределения $n$-грамм для текстов художественной литературы. Выяснилось, что точность идентификации в основном определяется индивидуальными особенностями эталонов, а не расстояниями между ними. Разработан алгоритм для тестирования системы эталонов на точность распознавания.