Аннотация:
В статье рассматривается ряд классических метрик (индекс сходства
разбиений, предложенный Рандом; коэффициент Ларсена–Аоне и др.)
между разбиениями одного множества. Унифицированы формулы для их
вычисления на основании одинаковых параметров. Разработан
вероятностный подход к сравнению приведенных мер близости
(сходства). Для этого требуется градуировка интервала возможных
значений мер близости между возможными разбиениями с помощью
квантилей функции распределения. Пусть ${\lambda }_{\alpha }$ —
квантиль уровня $\alpha $ для функции распределения $F_{\rho
}\left(t\right)=P\left(\rho <t\right)$. Тогда, если мера близости
$\rho $ оказывается не меньше, чем ${\lambda }_{\alpha }$, можно
сделать вывод, что $\alpha \cdot 100\%$ случайно выбранных пар
разбиений имеют между собой меру близости меньше, чем $\rho $.
Следовательно, их нельзя считать близкими или похожими. Получен
общий вид функции распределения для приведенных мер близости.
Подробно изучен случай равномерного распределения элемента
разбиения в любой группе. Для ряда мер близости приведены таблицы
квантилей функции распределения, которые были построены с помощью
компьютерного моделирования. Библиогр. 9 назв. Табл. 1.