RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2020, том 14, выпуск 4, страницы 47–54 (Mi ia696)

Методы детерминированных и рандомизированных энтропийных проекций для редукции размерности матрицы данных

Ю. С. Попковabc, А. Ю. Попковa, Ю. А. Дубновad

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук
b Институт проблем управления им. В. А. Трапезникова Российской академии наук
c ОРТ Брауде Колледж, Кармиель, Израиль
d Национальный исследовательский университет «Высшая школа экономики»

Аннотация: Предложены методы детерминированного и рандомизированного проектирования, ориентированные на решение задачи понижения размерности. В случае детерминированного проектирования развивается параллельная процедура сжатия матрицы данных, минимизирующая кросс-энтропию Кульбака–Лейблера с учетом ограничения на информационную емкость, основанная на методе проекции градиента. Для рандомизированного проектирования рассматривается задача понижения размерности признакового пространства. Идея применения процедур проектирования для сжатия матрицы данных реализуется в предлагаемом методе рандомизированного энтропийного проектирования, где используется принцип сохранения среднего расстояния между многомерными и маломерными точками в соответствующих пространствах. Задача поиска оптимальных проекторов сводится к поиску распределения вероятностей, максимизирующего информационную энтропию Ферми при ограничении на среднее расстояние между точками многообразия, которые отображаются матрицами данных и оптимальной проекции.

Ключевые слова: понижение размерности, кросс-энтропия Кульбака–Лейблера, энтропия.

Поступила в редакцию: 25.12.2019

DOI: 10.14357/19922264200407



© МИАН, 2024