RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2014, выпуск 36, страницы 92–113 (Mi trspy751)

Эта публикация цитируется в 1 статье

Методика выбора фонемного набора для автоматического распознавания русской речи

Д. А. Важенинаa, И. С. Кипятковаb, К. Марковa, А. А. Карповb

a Университет Аизу, Япония
b Федеральное государственное бюджетное учреждение науки Санкт-Петербургский институт информатики и автоматизации РАН (СПИИРАН)

Аннотация: В статье описывается выбор оптимального фонемного набора для системы автоматического распознавания русской речи. При создании акустических моделей был предложен комбинированный метод для выбора наилучшего фонемного набора, объединяющий статистическую информацию и фонетические знания. В результате применения данного метода к русскому фонетическому набору алфавита IPA (International Phonetic Alphabet) был получен набор из 47 фонологических единиц, который был преобразован в несколько фонемных наборов с разным размером от 27 до 47 единиц. Эксперименты по распознаванию речи показали, что использование сокращенных фонемных наборов позволяет увеличить точность распознавания фонем. В ходе экспериментов с применением расширенной языковой модели и сверхбольшим словарем точность распознавания слов составила 73,1%. Полученные результаты соответствуют качеству распознавания слитной русской речи, полученному на настоящий момент другими организациями.

Ключевые слова: автоматическое распознавание русской речи; акустическое моделирование; выбор фонемного набора.

УДК: 004.522

DOI: 10.15622/sp.36.6



© МИАН, 2024