RUS  ENG
Полная версия
ЖУРНАЛЫ // Известия Кабардино-Балкарского научного центра РАН // Архив

Известия Кабардино-Балкарского научного центра РАН, 2020, выпуск 6, страницы 20–33 (Mi izkab248)

Эта публикация цитируется в 1 статье

Системный анализ, управление и обработка информации

Современные проблемы автоматического распознавания речи

И. А. Гуртуева

Институт информатики и проблем регионального управления – филиал ФГБНУ «Федеральный научный центр «Кабардино-Балкарский научный центр Российской академии наук», 360000, КБР, г.  Нальчик, ул.  И.  Арманд, 37-а

Аннотация: В предлагаемой работе приведен краткий обзор наиболее применяемых методик в области моделирования распознавания речи. Обсуждаются различные принципы транскрипции, разработанные консорциумом лингвистических данных. Описаны проблемы оценки уровня человеческой эффективности при решении задачи распознавания речи, проанализированы типичные ошибки, допускаемые при этом человеком. Показано, что люди демонстрируют высокий уровень согласованности при точной транскрипции предварительно подготовленной англоязычной речи и быстрой транскрипции разговорной телефонной речи. Показано также, что с возрастанием сложности речи возрастает показатель разночтений между двумя и более независимыми стенографистами. Приведены результаты сравнительного анализа ошибок, генерируемых речевой системой и допускаемых человеком. Проанализированы их сходства и различия. Перечислены современные проблемы автоматического распознавания речи, оценены перспективы их решения и определены направления будущих исследований.

Ключевые слова: искусственный интеллект, искусственные нейронные сети, распознавание речи, глубокое обучение, эффективность человека.

УДК: 004.896

MSC: Primary 68T10; Secondary 68T50

Поступила в редакцию: 30.11.2020

DOI: 10.35330/1991-6639-2020-6-98-20-33



Реферативные базы данных:


© МИАН, 2024