RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2017, выпуск 50, страницы 55–92 (Mi trspy927)

Методы управления и обработки информации

Масштабируемые аудиоречевые кодеры на основе адаптивного частотно-временного анализа звуковых сигналов

А. А. Петровскийa, А. А. Петровскийb

a ООО «Техкомпания Хуавей»
b Белорусский государственный университет информатики и радиоэлектроники (БГУИР)

Аннотация: В статье рассматриваются методы перцептуальной субполосной обработки звуковых сигналов с динамической трансформацией частотно-временного плана на основе пакетного дискретного вейвлет-преобразования (ПДВП), достоинством которых является то, что рост дерева осуществляется сверху вниз, без возвратов на меньшие масштабные уровни преобразования и необходимости построения полного дерева ПДВП, что соответствует концепции реализации масштабируемых аудиоречевых кодеров в реальном масштабе времени. Приводятся объективные оценки качества предлагаемых кодеров на основе методики PEMO-Q и сравнения с широко распространенными кодерами Opus и Vorbis, которые показывают, что реконструированный сигнал соответствует требованиям стандарта ITU-R PEAQ при высокой степени компрессии в 18 и более раз, не содержит артефактов: отношение мощности шума к порогу маскирования NMR$_{total}$ меньше =-9 дБ.

Ключевые слова: масштабируемый аудио-речевой кодер; пакет дискретного вейвлет-преобразования; согласованная подгонка.

УДК: 004.032.6

DOI: 10.15622/sp.50.3



Реферативные базы данных:


© МИАН, 2024