И. С. Азаров, М. И. Вашкевич, Д. С. Лихачев, А. А. Петровский, “Изменение частоты основного тона речевого сигнала на основе гармонической модели с нестационарными параметрами”, Тр. СПИИРАН, 32 (2014), 5

Изменение частоты основного тона речевого сигнала на основе гармонической модели с нестационарными параметрами

И. С. Азаров, М. И. Вашкевич, Д. С. Лихачев, А. А. Петровский

Белорусский государственный университет информатики и радиоэлектроники

Аннотация: В статье предлагается решение задачи изменения частоты основного тона речевого сигнала. Необходимость решения данной задачи возникает во многих речевых приложениях таких как конверсия голоса, коррекция акцента, обеспечение конфиденциальности диктора и др. Разработанная схема обработки вокализованной части речевого сигнала основывается на гармонической модели с нестационарными (изменяющимися в каждый момент времени) параметрами. Для повышения частотного разрешения модели оценка параметров выполнятся при помощи узкополосной фильтрации в искривленном масштабе времени, согласованном с контуром мгновенной частоты основного тона. На основании субъективной оценки результатов показано, что разработанный способ обес-печивает высокую натуральность и разборчивость синтезированной речи и может применяться как в широкополосных так и в узкополосных каналах связи с различными стандартами кодирования (в том числе с кодеками G.711 и GSM).

Ключевые слова: гибридная модель речевого сигнала, оценка основного тона, изменение просодических характеристик речи.

УДК: 004.934