RUS  ENG
Полная версия
ЖУРНАЛЫ // Препринты Института прикладной математики им. М. В. Келдыша РАН // Архив

Препринты ИПМ им. М. В. Келдыша, 2001, 087 (Mi ipmp1139)

Нейросетевой анализ и сопоставление частотно-временных векторов на основе краткосрочного спектрального представления и адаптивного преобразования Эрмита

Ю. М. Баяковский, А. О. Жирков, Д. Н. Корчагин, А. С. Крылов, А. С. Лукин


Аннотация: В данной работе рассматривается метод распознавания речи/дикторов на основе представления речевой информации в виде потока двухмерных частотно-временных векторов. Классификация векторов осуществляется нейронной сетью, на вход к которой поступают низкочастотные двумерные вейвлет-преобразования участков спектрограмм. Исходными представлениями звука являются сонограммы краткосрочного преобразования Фурье и адаптивного преобразования Эрмита. Проведено сравнение этих представлений в задачах диктор-независимого распознавания речи и контекстно-независимого распознавания диктора.



© МИАН, 2024