RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика» // Архив

Вестн. ЮУрГУ. Сер. Выч. матем. информ., 2023, том 12, выпуск 1, страницы 46–60 (Mi vyurv292)

Эта публикация цитируется в 1 статье

Распознавание утомления человека на основе анализа его речи с помощью нейросетевых технологий

А. В. Яковлевab, В. О. Матыцинac, В. А. Велюгаb, К. А. Найденоваa, В. А. Пархоменкоd

a Военно-медицинская академия им. С.М. Кирова (194044 Санкт-Петербург, ул. Академика Лебедева, д. 6)
b Санкт-Петербургский государственный университет аэрокосмического приборостроения (190000 Санкт-Петербург, ул. Большая Морская, д. 67)
c Первый Санкт-Петербургский государственный медицинский университет им. И.П. Павлова Минздрава России (197022 Санкт-Петербург, ул. Льва Толстого, д. 6-8)
d Санкт-Петербургский политехнический университет Петра Великого (195251 Санкт-Петербург, ул. Политехническая, д. 29)

Аннотация: Качественные психофизиологические исследования сопряжены с созданием доступных и хорошо организованных баз данных, требующих большую предварительную работу по разработке измерительных комплексов, включающих не только средства для измерения психофизиологических параметров человека, но и его эмоционального состояния, которое отображается в выражении лица, речи и поведенческих паттернах респондентов. Измерительные комплексы должны также включать и средства обработки экспериментального материала. Суть исследования состояла в проведении эксперимента по созданию прототипа базы речевых данных русскоязычных респондентов, получения ответов на методические вопросы, возникающие у специалистов при использовании базы для задачи распознавания состояния утомления человека. Разработан аппаратно-программный комплекс, позволяющий синхронно регистрировать психофизиологические параметры, видеозаписи поведенческих реакций и аудиозапись речи человека. В качестве модели физического утомления использовался кардиореспираторный тест с физической нагрузкой. До прохождения и после завершении теста добровольцы зачитывали набор стандартных фонетически представительных текстов. Полученные аудиозаписи обрабатывались с помощью специализированной нейронной сети, способной анализировать интегральные спектральные характеристики звука. Результаты эксперимента показали возможность распознавания состояния утомления человека по его речи, что позволяет перейти к созданию большого банка аудиозаписей и совершенствованию алгоритмов распознавания состояния утомления.

Ключевые слова: распознавание утомления, база речевых данных, инструментальный комплекс, кардио-респираторный тест, машинное обучение, глубокая нейронная сеть.

УДК: 004.855.5

Поступила в редакцию: 15.11.2022

DOI: 10.14529/cmse230103



© МИАН, 2024