Д. А. Важенина, И. С. Кипяткова, К. Марков, А. А. Карпов, “Методика выбора фонемного набора для автоматического распознавания русской речи”, Тр. СПИИРАН, 36 (2014), 92

Эта публикация цитируется в 1 статье

Методика выбора фонемного набора для автоматического распознавания русской речи

Д. А. Важенина^a, И. С. Кипяткова^b, К. Марков^a, А. А. Карпов^b

^a Университет Аизу, Япония
^b Федеральное государственное бюджетное учреждение науки Санкт-Петербургский институт информатики и автоматизации РАН (СПИИРАН)

Аннотация: В статье описывается выбор оптимального фонемного набора для системы автоматического распознавания русской речи. При создании акустических моделей был предложен комбинированный метод для выбора наилучшего фонемного набора, объединяющий статистическую информацию и фонетические знания. В результате применения данного метода к русскому фонетическому набору алфавита IPA (International Phonetic Alphabet) был получен набор из 47 фонологических единиц, который был преобразован в несколько фонемных наборов с разным размером от 27 до 47 единиц. Эксперименты по распознаванию речи показали, что использование сокращенных фонемных наборов позволяет увеличить точность распознавания фонем. В ходе экспериментов с применением расширенной языковой модели и сверхбольшим словарем точность распознавания слов составила 73,1%. Полученные результаты соответствуют качеству распознавания слитной русской речи, полученному на настоящий момент другими организациями.

Ключевые слова: автоматическое распознавание русской речи; акустическое моделирование; выбор фонемного набора.

УДК: 004.522

DOI: 10.15622/sp.36.6