А. А. Петровский, А. А. Петровский, “Масштабируемые аудиоречевые кодеры на основе адаптивного частотно-временного анализа звуковых сигналов”, Тр. СПИИРАН, 2017, выпуск 50,страницы 55

Эта публикация цитируется в 1 статье

Методы управления и обработки информации

Масштабируемые аудиоречевые кодеры на основе адаптивного частотно-временного анализа звуковых сигналов

А. А. Петровский^a, А. А. Петровский^b

^a ООО «Техкомпания Хуавей»
^b Белорусский государственный университет информатики и радиоэлектроники (БГУИР)

Аннотация: В статье рассматриваются методы перцептуальной субполосной обработки звуковых сигналов с динамической трансформацией частотно-временного плана на основе пакетного дискретного вейвлет-преобразования (ПДВП), достоинством которых является то, что рост дерева осуществляется сверху вниз, без возвратов на меньшие масштабные уровни преобразования и необходимости построения полного дерева ПДВП, что соответствует концепции реализации масштабируемых аудиоречевых кодеров в реальном масштабе времени. Приводятся объективные оценки качества предлагаемых кодеров на основе методики PEMO-Q и сравнения с широко распространенными кодерами Opus и Vorbis, которые показывают, что реконструированный сигнал соответствует требованиям стандарта ITU-R PEAQ при высокой степени компрессии в 18 и более раз, не содержит артефактов: отношение мощности шума к порогу маскирования NMR$_{total}$ меньше =-9 дБ.

Ключевые слова: масштабируемый аудио-речевой кодер; пакет дискретного вейвлет-преобразования; согласованная подгонка.

УДК: 004.032.6

DOI: 10.15622/sp.50.3