RUS  ENG
Полная версия
ЖУРНАЛЫ // Автоматика и телемеханика // Архив

Автомат. и телемех., 2014, выпуск 12, страницы 125–138 (Mi at14166)

Эта публикация цитируется в 15 статьях

Интеллектуальные системы управления

Реализация автоматической системы многомодального распознавания речи по аудио- и видеоинформации

А. А. Карповab

a Санкт-Петербургский институт информатики и автоматизации РАН
b Университет ИТМО, Санкт-Петербург

Аннотация: Представлена математическая модель и программная реализация автоматической системы распознавания русской речи с применением методов цифровой обработки и анализа аудиовизуальных сигналов от микрофона и видеокамеры. Приведено описание вероятностного моделирования аудиовизуальной речи на основе математического аппарата сдвоенных скрытых марковских моделей, методов объединения информации с применением весовых коэффициентов аудио- и видеомодальностей речи и параметрического представления сигналов. Количественные результаты по многомодальному распознаванию слитной русской речи свидетельствуют о высокой точности и надежности работы автоматической системы.

Статья представлена к публикации членом редколлегии: А. В. Бернштейн

Поступила в редакцию: 28.03.2012


 Англоязычная версия: Automation and Remote Control, 2014, 75:12, 2190–2200

Реферативные базы данных:


© МИАН, 2024