RUS  ENG
Полная версия
ЖУРНАЛЫ // Автоматика и телемеханика // Архив

Автомат. и телемех., 2017, выпуск 5, страницы 110–122 (Mi at14446)

Эта публикация цитируется в 13 статьях

Анализ данных

Исследование нейросетевых моделей русского языка для систем автоматического распознавания слитной речи

И. С. Кипятковаab, А. А. Карповa

a Санкт-Петербургский институт информатики и автоматизации РАН
b Санкт-Петербургский государственный университет аэрокосмического приборостроения

Аннотация: Приводятся результаты исследований моделей русского языка, построенных на основе рекуррентных искусственных нейронных сетей, для систем автоматического распознавания слитной речи. Созданы нейросетевые модели с различным числом элементов в скрытом слое, а также выполнена линейная интерполяция нейросетевых моделей с базовой триграммной моделью языка. Полученные модели использовались на этапе переоценки списка лучших гипотез распознавания. В ходе экспериментов по распознаванию слитной русской речи со сверхбольшим словарем (150 тыс. словоформ) относительное уменьшение процента неправильно распознанных слов, полученное после выполнения переоценки списка 50 лучших гипотез распознавания с использованием нейросетевых моделей языка, интерполированных с триграммной моделью, составило 14 %.

Ключевые слова: модели языка, нейронные сети, автоматическое распознавание речи, русская речь.

PACS: 43.72.+q

MSC: 68T50

Статья представлена к публикации членом редколлегии: В. И. Васильев

Поступила в редакцию: 28.04.2016


 Англоязычная версия: Automation and Remote Control, 2017, 78:5, 858–867

Реферативные базы данных:


© МИАН, 2024