RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Информатика и автоматизация, 2021, выпуск 20, том 2, страницы 435–462 (Mi trspy1149)

Эта публикация цитируется в 2 статьях

Искусственный интеллект, инженерия данных и знаний

Быстрый трекинг зрачка, основанный на исследовании гранично-ступенчатой модели изображения и многомерной оптимизации методом Хука-Дживса

Ю. В. Грушко, Р. И. Паровик

ФГБОУ ВО «Камчатский государственный университет им. Витуса Беринга»

Аннотация: Предлагается новый быстрый метод регистрации движения глаз в режиме реального времени на основе исследования гранично-ступенчатой модели полутонового изображения оператором Лапласиан – Гауссиана и нахождения нового предложенного дескриптора накопленных разностей (идентификатора точек), который отображает меру равноудаленности каждой точки от границ некоторой относительно монотонной области (например, зрачок глаза). Работа данного дескриптора исходит из предположения о том, что зрачок в кадре является наиболее округлой монотонной областью, имеющей высокий перепад яркости на границе, пиксели области должны иметь интенсивность меньше заранее заданного порога (но при этом зрачок может не являться самой темной областью на изображении). Учитывая все вышеперечисленные характеристики зрачка, дескриптор позволяет достичь высокой точности детектирования его центра и размера в отличии от методов, основанных на пороговой сегментации изображения, опирающихся на предположение о зрачке как наиболее темной области, морфологических методов (рекурсивная морфологическая эрозия), корреляционных или методов, исследующих только граничную модель изображения (преобразование Хафа и его вариации с двумерным и трехмерным пространствами параметров, алгоритм Starburst, Swirski, RANSAC, ElSe).
Исследована возможность представления задачи трекинга зрачка как задачи многомерной оптимизации и ее решение неградиентным методом Хука –Дживса, где в качестве целевой функции выступает функция, выражающая дескриптор. При этом отпадает необходимость в вычислении дескриптора каждой точки изображения (составления специальной аккумуляторной функции), что значительно ускоряет работу метода.
Проведен анализ предложенных дескриптора и метода, а также разработан программный комплекс на языке Python 3 (визуализация) и C++ (ядро трекинга) в лаборатории физико-математического факультета Камчатского государственного университета им. Витуса Беринга, позволяющий иллюстрировать работу метода и осуществлять трекинг зрачка в режиме реального времени.

Ключевые слова: математические модели, детекторы, дескрипторы, окулография, айтрекинг, амиотрофический склероз, зрачок, Лапласиан-Гауссиана, метод Хука-Дживса, численная оптимизация, преобразование Хафа.

УДК: 004.93, 004.94

Поступила в редакцию: 12.01.2021

DOI: 10.15622/ia.2021.20.2.7



© МИАН, 2024