Е. Г. Жиляков, С. П. Белов, А. С. Белов, А. А. Медведева, “Обнаружение пауз между словными фрагментами записей речевых сигналов”, ИТиВС, 2022, выпуск 1,страницы 40

ОБРАБОТКА ИНФОРМАЦИИ И АНАЛИЗ ДАННЫХ

Обнаружение пауз между словными фрагментами записей речевых сигналов

Е. Г. Жиляков^a, С. П. Белов^b, А. С. Белов^b, А. А. Медведева^a

^a Федеральное государственное автономное образовательное учреждение высшего образования "Белгородский государственный национальный исследовательский университет", г. Белгород, Россия
^b Автономная некоммерческая организация высшего образования "Белгородский университет кооперации, экономики и права", г. Белгород, Россия

Аннотация: В работе рассматривается задача сегментации записей речевых сигналов на отрезки, порождаемые в присутствии речи (словные отрезки), и паузы между ними. Такая сегментация является важным этапом идентификации речевых компонент на основе некоторых признаков. Предполагается, что отрезки речевого сигнала в паузах речи являются выборками из стационарной последовательности отсчетов, (шумы в паузах). В качестве основной характеристики шумов в паузах предлагается использовать оценки по обучающей выборке математических ожиданий частей энергий их отрезков некоторой конечной длительности в заранее определенных частотных полосах (субполосный анализ). Показано, что использование максимального из отношений частей энергий текущего анализируемого отрезка к соответствующим математическим ожиданиям частей энергий отрезков шумов позволяет в максимальной степени учесть возможное присутствие речевой компоненты. Этот эффект равносилен максимизации отношения сигнал/шум, то есть предлагаемая решающая функция в этом смысле является оптимальной.

Ключевые слова: сегментация записей речевых сигналов, субполосный анализ, оптимальная решающая функция.

DOI: 10.14357/20718632220105