Аннотация:
Рассмотрен вопрос качества аудиосигнала во время проведения видеоконференций. Описано влияние шумов на качество и разборчивость речевого сигнала. Проведен анализ процесса шумоподавления в аудиосигнале в реальном времени. Выделены основные проблемы, возникающие при цифровой обработке аудиосигнала в реальном времени. Рассмотрены основные методы шумоподавления и выявлены недостатки классических методов. Сформулирована проблема устранения шумов с переменной полосой частот классическими методами шумоподавления. Обоснована необходимость создания гибридной методики шумоподавления с использованием методов машинного и глубокого обучения для устранения как статичных шумов, так и шумов со сложной и переменной спектральной характеристикой. Выделены основные подходы к решению задачи шумоподавления в реальном времени, а именно подход с распознаванием и устранением шумов и подход с распознаванием голоса и устранением звуков, отличающихся от речевого сигнала. Описан алгоритм шумоподавления на основе подхода с распознаванием и устранением шумов. Предложена оптимизация алгоритма путем разложения спектра входного сигнала согласно шкале Барка. Предложена рекуррентная нейронная сеть в качестве инструмента для реализации алгоритма шумоподавления. Определены форматы входных и выходных данных нейронной сети, а также формат обучающих данных. Описана модель корректировки параметров и правил для возможности адаптации алгоритма шумоподавления к специфичным условиям эксплуатации. Предложена гибридная методика шумоподавления, комбинирующая классические методы шумоподавления и методы, основанные на рекуррентной нейронной сети. Разработана схема гибридной методики. Предложен способ тестирования эффективности методики шумоподавления.