RUS  ENG
Полная версия
ЖУРНАЛЫ // Известия Кабардино-Балкарского научного центра РАН // Архив

Известия Кабардино-Балкарского научного центра РАН, 2019, выпуск 3, страницы 3–14 (Mi izkab31)

Эта публикация цитируется в 4 статьях

ИНФОРМАТИКА. ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА. УПРАВЛЕНИЕ

Базовые элементы когнитивной модели механизма восприятия речи на основе мультиагентного рекурсивного интеллекта

З. В. Нагоевa, И. А. Гуртуеваb

a ФГБНУ «Федеральный научный центр «Кабардино-Балкарский научный центр Российской академии наук», 360002, КБР, г. Нальчик, ул. Балкарова, 2
b Институт информатики и проблем регионального управления – филиал ФГБНУ «Федеральный научный центр «Кабардино-Балкарский научный центр Российской академии наук», 360000, КБР, г.  Нальчик, ул.  И.  Арманд, 37-а

Аннотация: В данной работе проанализирована обобщенная архитектура, лежащая в основе практически всех современных систем автоматического распознавания речи. Кратко изложена необходимость разработки принципиально нового подхода к решению проблем распознавания речи. Предлагается формальное описание структуры акта речевосприятия для применения в качестве общей теоретической основы при разработке универсальных систем автоматического распознавания речи, высокоэффективных в условиях высокой зашумленности и ситуациях «cocktail party». Разработана общая структурная динамика процесса распознавания речи, позволяющая учесть лингвистические и экстралингвистические аспекты речевого сообщения. Доказана необходимость использования понятия артикуляционного события в качестве минимального базового паттерна распознавания звукового образа.
Процесс распознавания структурирован на основе функциональной детерминанты «ситуация». Необходимость анализа многочисленных источников информации, сопровождающих звуковое сообщение, отказ от поиска инварианта носят здесь принципиальный характер. Формальными средствами для реализации выбраны мультиагентные системы. Мультиагентный подход позволяет дифференцировать и анализировать звуки разной природы. Это делает предложенную модель уникальной и дает ей преимущества в ситуации так называемой «cocktail party», а также в задачах, где уровень шумов крайне высок.

Ключевые слова: мультиагентные системы, искусственный интеллект, искусственные нейронные сети, распознавание речи.

УДК: 004.896

Поступила в редакцию: 05.06.2019

DOI: 10.35330/1991-6639-2019-3-89-3-14



Реферативные базы данных:


© МИАН, 2024