RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическое моделирование // Архив

Матем. моделирование, 2015, том 27, номер 7, страницы 51–57 (Mi mm3622)

Об обучении системы верификации диктора на неразмеченных данных

А. В. Ермилов, И. М. Гостев

Национальный исследовательский университет "Высшая школа экономики"

Аннотация: Исследуются способы получения автоматической разметки речевых данных по дикторам с помощью алгоритмов кластеризации с последующим получением смеси моделей, используемых для распознавания диктора. Такая задача возникает, например, в случае необходимости использования данных из новых каналов, например, данных, полученных с мобильных устройств. Для таких каналов, как правило, отсутствует большая размеченная база по дикторам, которая в дальнейшем может быть использована для построения системы верификации диктора. Кроме того, рассматривается задача верификации диктора и способы её решения на основе моделей GMM-UBM, приведен обзор методов нормализации влияния канала, используемых для увеличения точности распознавания. Изложен обзор современных методов верификации диктора, таких как супервекторы и PLDA. Также в статье исследуется качество разметки, полученной методом иерархической кластеризации с различными метриками, и приводятся результаты численных экспериментов по верификации диктора на базе i-векторов из NIST i-vector Machine Learning Challenge 2014 с помощью модели, обученной на полученной разметке.

Ключевые слова: распознавание образов, автоматическая верификация диктора, кластеризация, PLDA.

Поступила в редакцию: 30.03.2015



Реферативные базы данных:


© МИАН, 2024