Д. С. Обухов, “Клонирование и конверсия произвольного голоса с использованием генеративных потоков”, Автомат. и телемех., 2022, выпуск 10,страницы 80

Эта публикация цитируется в 1 статье

Тематический выпуск

Клонирование и конверсия произвольного голоса с использованием генеративных потоков

Д. С. Обухов

Новосибирский государственный технический университет

Аннотация: С целью повышения качества формируемого речевого сигнала в данной работе предложен способ учета переменной во времени информации о спикере. Благодаря этой технике система синтезирует более естественную речь голосом, похожим на заданный целевой голос, как в задаче клонирования голоса, так и в задаче конверсии голоса.

Ключевые слова: клонирование голоса, конверсия голоса, синтез речи, потоковые генеративные модели, эмбеддинги спикера, частота основного тона.

Статья представлена к публикации членом редколлегии: А. А. Лазарев

Поступила в редакцию: 22.01.2022
После доработки: 25.04.2022
Принята к публикации: 29.06.2022

DOI: 10.31857/S0005231022100087