Прикладная математика
A probabilistic approach to comparing the distances between partitions of a set
[Вероятностный подход к сравнению мер близости между разбиениями множества]
A. A. Rogova,
A. G. Varfolomeyeva,
A. O. Timonina,
K. A. Proençab a Petrozavodsk State University, 33, Lenin pr., Petrozavodsk,
185910, Russian Federation
b Feedzai, Avenida D. Joao II, Lote 1.16.01 Piso 11, Lisbon, 1990-083, Portugal
Аннотация:
В статье рассматривается ряд классических метрик (индекс сходства
разбиений, предложенный Рандом; коэффициент Ларсена–Аоне и др.)
между разбиениями одного множества. Унифицированы формулы для их
вычисления на основании одинаковых параметров. Разработан
вероятностный подход к сравнению приведенных мер близости
(сходства). Для этого требуется градуировка интервала возможных
значений мер близости между возможными разбиениями с помощью
квантилей функции распределения. Пусть
${\lambda }_{\alpha }$ —
квантиль уровня
$\alpha $ для функции распределения $F_{\rho
}\left(t\right)=P\left(\rho <t\right)$. Тогда, если мера близости
$\rho $ оказывается не меньше, чем
${\lambda }_{\alpha }$, можно
сделать вывод, что
$\alpha \cdot 100\%$ случайно выбранных пар
разбиений имеют между собой меру близости меньше, чем
$\rho $.
Следовательно, их нельзя считать близкими или похожими. Получен
общий вид функции распределения для приведенных мер близости.
Подробно изучен случай равномерного распределения элемента
разбиения в любой группе. Для ряда мер близости приведены таблицы
квантилей функции распределения, которые были построены с помощью
компьютерного моделирования. Библиогр. 9 назв. Табл. 1.
Ключевые слова:
меры близости между разбиениями множеств,
вероятностный подход, сравнение мер близости.
УДК:
519.213 Поступила: 7 октября 2017 г.Принята к печати:
11 января 2018 г.
Язык публикации: английский
DOI:
10.21638/11701/spbu10.2018.102