RUS  ENG
Полная версия
ЖУРНАЛЫ // Автоматика и телемеханика // Архив

Автомат. и телемех., 2021, выпуск 4, страницы 140–160 (Mi at15527)

Интеллектуальные системы управления, aнализ данных

Метод энтропийно-рандомизированного восстановления пропущенных данных

Ю. А. Дубновabc, В. Ю. Полищукde, Ю. С. Попковafg, Ю. М. Полищукh, А. В. Мельниковh, Е. С. Соколh

a Институт системного анализа Федерального исследовательского центра “Информатика и управление” РАН, Москва
b Национальный исследовательский университет “Высшая школа экономики”, Москва
c Московский физико-технический институт
d Национальный исследовательский Томский политехнический университет
e Институт мониторинга климатических и экологических систем СО РАН
f Брауде Колледж университета Хайфы, Кармиель, Израиль
g Институт проблем управления им. В.А. Трапезникова РАН, Москва
h Югорский НИИ информационных технологий, Ханты-Мансийск

Аннотация: Статья посвящена проблеме восстановления про́пусков в коллекциях данных для задач машинного обучения. Предложен новый рандомизированный метод восстановления пропущенных данных, основанный на технологии энтропийно-робастного оценивания и генерации ансамблей случайных величин. Предложенный метод схож с использованием вспомогательной регрессии для восстановления пропущенных значений, но в отличие от последней в случае энтропийного оценивания не накладываются дополнительные ограничения на функцию правдоподобия ошибок в выборке и допустимы малые объемы данных, что становится крайне актуальным в задачах, когда объем данных для обучения ограничен, а пропуски встречаются не систематически. Предложенный метод применяется для восстановления пропущенных данных о площадях термокарстовых озер арктической зоны РФ, измеряемых по спутниковым снимкам.

Ключевые слова: восстановление пропусков, энтропийное оценивание, рандомизированное машинное обучение, термокарстовые озера, Арктика.

Статья представлена к публикации членом редколлегии: А. И. Михальский

Поступила в редакцию: 24.07.2020
После доработки: 27.10.2020
Принята к публикации: 08.12.2020

DOI: 10.31857/S0005231021040061


 Англоязычная версия: Automation and Remote Control, 2021, 82:4, 670–686

Реферативные базы данных:


© МИАН, 2024