RUS  ENG
Полная версия
ЖУРНАЛЫ // Информационные технологии и вычислительные системы // Архив

ИТиВС, 2022, выпуск 1, страницы 40–46 (Mi itvs757)

ОБРАБОТКА ИНФОРМАЦИИ И АНАЛИЗ ДАННЫХ

Обнаружение пауз между словными фрагментами записей речевых сигналов

Е. Г. Жиляковa, С. П. Беловb, А. С. Беловb, А. А. Медведеваa

a Федеральное государственное автономное образовательное учреждение высшего образования "Белгородский государственный национальный исследовательский университет", г. Белгород, Россия
b Автономная некоммерческая организация высшего образования "Белгородский университет кооперации, экономики и права", г. Белгород, Россия

Аннотация: В работе рассматривается задача сегментации записей речевых сигналов на отрезки, порождаемые в присутствии речи (словные отрезки), и паузы между ними. Такая сегментация является важным этапом идентификации речевых компонент на основе некоторых признаков. Предполагается, что отрезки речевого сигнала в паузах речи являются выборками из стационарной последовательности отсчетов, (шумы в паузах). В качестве основной характеристики шумов в паузах предлагается использовать оценки по обучающей выборке математических ожиданий частей энергий их отрезков некоторой конечной длительности в заранее определенных частотных полосах (субполосный анализ). Показано, что использование максимального из отношений частей энергий текущего анализируемого отрезка к соответствующим математическим ожиданиям частей энергий отрезков шумов позволяет в максимальной степени учесть возможное присутствие речевой компоненты. Этот эффект равносилен максимизации отношения сигнал/шум, то есть предлагаемая решающая функция в этом смысле является оптимальной.

Ключевые слова: сегментация записей речевых сигналов, субполосный анализ, оптимальная решающая функция.

DOI: 10.14357/20718632220105



Реферативные базы данных:


© МИАН, 2024