RUS  ENG
Полная версия
ЖУРНАЛЫ // Ученые записки Ереванского государственного университета, серия Физические и Математические науки // Архив

Уч. записки ЕГУ, сер. Физика и Математика, 2024, том 58, выпуск 1, страницы 22–29 (Mi uzeru1090)

Информатика

Adaptive noise cancellation for robust speech recognition in noisy environments

[Адаптивное шумоподавление для надежного распознавания речи в условиях шума]

D. S. Karamyan

Yerevan State University, Faculty of Informatics and Applied Mathematics

Аннотация: В данной статье рассматриваются проблемы, которые появляются при объединении моделей шумоподавления и автоматического распознавания речи (АРР). Когда эти модели объединяются напрямую, производительность распознавания слов часто страдает из-за изменения распределения входных данных. Чтобы преодолеть это ограничение, в данной статье рассматривается новый метод объединения этих моделей, который повышает способность модели АРР хорошо работать в шумной среде.
Ключевой особенностью предлагаемого метода является введение механизма управления агрессивностью шумоподавления. Этот механизм позволяет настроить процесс снижения шума в соответствии с конкретными требованиями модели АРР без необходимости какого-либо переобучения. Это преимущество делает данный метод применимым к любой модели АРР, облегчая его реализацию в практических сценариях.

Ключевые слова: automatic speech recognition, noise cancellation, noise robustness, domain adaptation

MSC: 68T10

Поступила в редакцию: 28.12.2023
Исправленный вариант: 19.02.2024
Принята в печать: 28.02.2024

Язык публикации: английский

DOI: 10.46991/PYSU:A.2024.58.1.022



© МИАН, 2025