Аннотация:
Исследуются способы получения автоматической разметки речевых данных по дикторам с помощью алгоритмов кластеризации с последующим получением смеси моделей, используемых для распознавания диктора. Такая задача возникает, например, в случае необходимости использования данных из новых каналов, например, данных, полученных с мобильных устройств. Для таких каналов, как правило, отсутствует большая размеченная база по дикторам, которая в дальнейшем может быть использована для построения системы верификации диктора. Кроме того, рассматривается задача верификации диктора и способы её решения на основе моделей GMM-UBM, приведен обзор методов нормализации влияния канала, используемых для увеличения точности распознавания. Изложен обзор современных методов верификации диктора, таких как супервекторы и PLDA. Также в статье исследуется качество разметки, полученной методом иерархической кластеризации с различными метриками, и приводятся результаты численных экспериментов по верификации диктора на базе i-векторов из NIST i-vector Machine Learning Challenge 2014 с помощью модели, обученной на полученной разметке.