Аннотация:
Предложены методы детерминированного и рандомизированного проектирования, ориентированные на решение задачи понижения размерности. В случае детерминированного проектирования развивается параллельная процедура сжатия матрицы данных, минимизирующая кросс-энтропию Кульбака–Лейблера с учетом ограничения на информационную емкость, основанная на методе проекции градиента. Для рандомизированного проектирования рассматривается задача понижения размерности признакового пространства. Идея применения процедур проектирования для сжатия матрицы данных реализуется в предлагаемом методе рандомизированного энтропийного проектирования, где используется принцип сохранения среднего расстояния между многомерными и маломерными точками в соответствующих пространствах. Задача поиска оптимальных проекторов сводится к поиску распределения вероятностей, максимизирующего информационную энтропию Ферми при ограничении на среднее расстояние между точками многообразия, которые отображаются матрицами данных и оптимальной проекции.