RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2011, выпуск 19, страницы 48–64 (Mi trspy467)

Многомодальные ассистивные системы для интеллектуального жилого пространства

А. А. Карповa, Л. Акарунb, Ал. Л. Ронжинa

a Санкт-Петербургский институт информатики и автоматизации РАН
b Bogazici University, Bebek, Istanbul

Аннотация: В статье представлен обзор систем, применяемых для ассистивного интеллектуального пространства. Также описывается разработанная многомодальная ассистивная система для интеллектуального жилого пространства, которая состоит из двух комплексов средств. Первый комплекс выполняет обработку видеопотоков для определения положения пользователя и слежения за его перемещением, а также анализа его действий. Ко второму комплексу относится система обработки аудиопотоков, предназначенная для автоматического распознавания речевых команд и акустических событий. Разработанная система автоматического распознавания речи многоязычна и позволяет распознавать слова, произнесенные на английском или русском. В процессе проведения экспериментов было записано 2811 аудиофайлов, содержащих речь и акустические события, средняя точность распознавания составила 96,5% и 93,8% соответственно.

Ключевые слова: системы видеонаблюдения, сегментация переднего фона, слежение за ключевыми точками, обработка аудиосигнала, распознавание речи, определение акустических событий.

УДК: 004.522

MSC: 68

Поступила в редакцию: 16.11.2011
Принята в печать: 29.11.2011



© МИАН, 2024