RUS  ENG
Полная версия
ЖУРНАЛЫ // Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика // Архив

Изв. Сарат. ун-та. Нов. сер. Сер.: Математика. Механика. Информатика, 2017, том 17, выпуск 4, страницы 452–464 (Mi isu738)

Научный отдел
Информатика

Разработка системы распознавания речи на основе скрытых марковских моделей отдельных слов

А. Н. Савин, Н. Е. Тимофеева, А. С. Гераськин, Ю. А. Мавлютова

Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского, 410012, Россия, Саратов, Астраханская, 83

Аннотация: Приведены результаты разработки программных модулей, реализующих систему распознавания речи на основе скрытых Марковских моделей отдельных слов и использования линейного предсказания при кодировании признаков звукового сигнала. Обосновывается структура системы распознавания речи, использующая скрытые марковские модели отдельных слов, состоящая из четырех модулей: модуль выделения слов из звукового потока, модуль анализа признаков слова, модуль обучения скрытых марковских моделей и модуль распознавания слов. Приводятся алгоритмы формирования скрытых марковских моделей с лево-правой топологией для отдельных слов требуемого словаря команд системы управления объекта, основанные на кодировании признаков звукового сигнала, использующего линейные предсказания. Приведены результаты оценки достоверности последовательности наблюдений, соответствующих отдельным словам, получаемым с помощью предложенного алгоритма обработки. Разработанные программные модули позволяют эффективно подготавливать необходимые исходные данные и формировать таким образом требуемый словарь команд системы управления объекта, строить скрытые марковские модели отдельных слов, проводить их обучение с помощью алгоритма Баума–Велша. Построенные словари команд предполагается использовать в интеллектуальных системах управления различными объектами.

Ключевые слова: скрытые марковские модели, кепстральный анализ, распознавание речи, метод Баума–Велша.

УДК: 004.934

DOI: 10.18500/1816-9791-2017-17-4-452-464



Реферативные базы данных:


© МИАН, 2024