Аннотация:
В данной работе проанализирована обобщенная архитектура, лежащая в основе практически
всех современных систем автоматического распознавания речи. Кратко изложена необходимость
разработки принципиально нового подхода к решению проблем распознавания речи. Предлагается
формальное описание структуры акта речевосприятия для применения в качестве общей
теоретической основы при разработке универсальных систем автоматического распознавания
речи, высокоэффективных в условиях высокой зашумленности и ситуациях «cocktail party».
Разработана общая структурная динамика процесса распознавания речи, позволяющая учесть
лингвистические и экстралингвистические аспекты речевого сообщения. Доказана необходимость
использования понятия артикуляционного события в качестве минимального базового паттерна
распознавания звукового образа.
Процесс распознавания структурирован на основе функциональной детерминанты
«ситуация». Необходимость анализа многочисленных источников информации, сопровождающих
звуковое сообщение, отказ от поиска инварианта носят здесь принципиальный характер.
Формальными средствами для реализации выбраны мультиагентные системы.
Мультиагентный подход позволяет дифференцировать и анализировать звуки разной природы.
Это делает предложенную модель уникальной и дает ей преимущества в ситуации так
называемой «cocktail party», а также в задачах, где уровень шумов крайне высок.
Ключевые слова:мультиагентные системы, искусственный интеллект, искусственные нейронные сети, распознавание речи.