RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2016, выпуск 44, страницы 98–113 (Mi trspy857)

Эта публикация цитируется в 4 статьях

Методы управления и обработки информации

Анализ перспектив применения высокоскоростных камер для распознавания динамической видеоинформации

Д. В. Иванькоa, А. А. Карповb

a Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики (Университет ИТМО)
b Федеральное государственное бюджетное учреждение науки Санкт-Петербургский институт информатики и автоматизации Российской академии наук (СПИИРАН)

Аннотация: Рассматриваются актуальные и перспективные направления по использованию высокоскоростных видеокамер. Обсуждается возможность применения высокоскоростных камер в области человеко-машинного взаимодействия для автоматического распознавания динамической видеоинформации (в том числе визуальной речи диктора). Выделяются основные задачи взаимодействия, решаемые с помощью высокоскоростных камер, такие как: автоматическое чтение речи по губам диктора, обнаружение моргания, распознавание микровыражений. Обозначаются возможные проблемы, связанные с внедрением высокоскоростных видеокамер. Анализируется состояние области исследований на настоящий момент и доказывается, что имеется высокая актуальность развития данного научно-технического направления. Предлагаются многообещающие области применения и задачи организации человеко-машинного взаимодействия с применением высокоскоростной видеосъемки. Основными направлениями являются аудиовизуальное распознавание слитной речи и чтение речи по губам диктора. В ходе дальнейших исследований планируется реализация подобной многомодальной системы аудиовизуального распознавания речи для русского языка с использованием микрофона и высокоскоростной видеокамеры JAI Pulnix.

Ключевые слова: высокоскоростная видеокамера; компьютерное зрение; аудиовизуальное распознавание речи; аудиовизуальная база данных; чтение по губам; динамическая видеоинформация.

УДК: 004.5

DOI: 10.15622/sp.44.7



Реферативные базы данных:


© МИАН, 2024