RUS  ENG
Полная версия
ЖУРНАЛЫ // Ученые записки Казанского университета. Серия Физико-математические науки // Архив

Учен. зап. Казан. ун-та. Сер. Физ.-матем. науки, 2013, том 155, книга 4, страницы 109–117 (Mi uzku1246)

Эта публикация цитируется в 2 статьях

Mid-level features for audio chord recognition using a deep neural network

[Промежуточное представление звуковых данных с использованием многослойной нейронной сети для задачи распознавания аккордов]

N. Glazyrin

Department of Algebra and Discrete Mathematics, Ural Federal University named after B. N. Yeltsin, Ekaterinburg, Russia

Аннотация: Глубокие нейронные сети, состоящие из нескольких предварительно обученных слоёв, успешно применяются в задачах, связанных с обработкой звука. В данной работе предложены и рассмотрены применительно к задаче распознавания аккордов некоторые конфигурации глубоких нейронных сетей (в том числе рекуррентных), допускающие предварительное послойное обучение при помощи многослойных очищающих автоассоциаторов. Рассмотренные нейронные сети позволяют преобразовывать спектрограмму звукозаписи в последовательность векторов признаков, по которой затем определяются звучащие аккорды. Качество распознавания аккордов, достигнутое с использованием описанных признаков, сравнивается с качеством распознавания аккордов, достигнутым при помощи часто используемых хроматических признаков, при вычислении которых не используются методы машинного обучения.

Ключевые слова: распознавание аккордов, автоассоциатор, рекуррентная нейронная сеть, глубокое обучение.

УДК: 004.93

Поступила в редакцию: 02.08.2013

Язык публикации: английский



© МИАН, 2024