RUS  ENG
Полная версия
ЖУРНАЛЫ // Автоматика и телемеханика // Архив

Автомат. и телемех., 2022, выпуск 10, страницы 80–93 (Mi at16053)

Эта публикация цитируется в 1 статье

Тематический выпуск

Клонирование и конверсия произвольного голоса с использованием генеративных потоков

Д. С. Обухов

Новосибирский государственный технический университет

Аннотация: С целью повышения качества формируемого речевого сигнала в данной работе предложен способ учета переменной во времени информации о спикере. Благодаря этой технике система синтезирует более естественную речь голосом, похожим на заданный целевой голос, как в задаче клонирования голоса, так и в задаче конверсии голоса.

Ключевые слова: клонирование голоса, конверсия голоса, синтез речи, потоковые генеративные модели, эмбеддинги спикера, частота основного тона.

Статья представлена к публикации членом редколлегии: А. А. Лазарев

Поступила в редакцию: 22.01.2022
После доработки: 25.04.2022
Принята к публикации: 29.06.2022

DOI: 10.31857/S0005231022100087


 Англоязычная версия: Automation and Remote Control, 2022, 83:10, 1555–1566


© МИАН, 2024