RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2013, выпуск 31, страницы 20–42 (Mi trspy695)

Сегментация и дифонное распознавание речевых сигналов

А. К. Бурибаеваa, Г. В. Дорохинаb, А. В. Ниценкоb, В. Ю. Шелеповb

a Евразийский национальный университет им. Л. Н. Гумилёва, г. Астана
b Институт проблем искусственного интеллекта НАН Украины и МОН Украины, г. Донецк

Аннотация: Статья посвящена описанию разработанной в Институте проблем искусственного интеллекта НАН и МОН Украины (Донецк) технологии распознавания речи, основанной на следующих основных этапах обработки: сегментация с использованием численного аналога полной вариации; создание дифонной базы; DTW-распознавание слов по эталонам, автоматически создаваемым из эталонов дифонов. Разработанная технология применима к распознаванию сверхбольших словарей, а также при разработке текстовых редакторов с голосовым вводом.

Ключевые слова: сегментация речевого сигнала, дифон, DTW-распознавание.

УДК: 004.934.2

Поступила в редакцию: 22.10.2013



© МИАН, 2024