Аннотация:
В работе рассматривается задача сегментации записей речевых сигналов на отрезки, порождаемые в присутствии речи (словные отрезки), и паузы между ними. Такая сегментация является важным этапом идентификации речевых компонент на основе некоторых признаков. Предполагается, что отрезки речевого сигнала в паузах речи являются выборками из стационарной последовательности отсчетов, (шумы в паузах). В качестве основной характеристики шумов в паузах предлагается использовать оценки по обучающей выборке математических ожиданий частей энергий их отрезков некоторой конечной длительности в заранее определенных частотных полосах (субполосный анализ). Показано, что использование максимального из отношений частей энергий текущего анализируемого отрезка к соответствующим математическим ожиданиям частей энергий отрезков шумов позволяет в максимальной степени учесть возможное присутствие речевой компоненты. Этот эффект равносилен максимизации отношения сигнал/шум, то есть предлагаемая решающая функция в этом смысле является оптимальной.