Аннотация:
Одной из актуальных задач при работе с большими массивами данных является задача их экономного представления, для решения которой необходимо выявить значимые признаки и удалить шумовые. Такие задачи встречаются в самых различных областях, таких как генетика, биология, астрономия, компьютерная графика, обработка аудио- и видеоданных и т. д. В современных исследованиях в этой области описаны различные методы фильтрации, основанные на разреженном представлении получаемых экспериментальных данных. Для построения статистических оценок на основе наблюдаемых данных широко используется процедура множественной проверки гипотез о значимости наблюдений. В данной работе рассмотрен FDR (False Discovery Rate) метод, основанный на контроле ожидаемой доли ложных отклонений нулевой гипотезы, и алгоритм Бенжамини–Хочберга для множественной проверки гипотез. Зачастую информация, доступная для наблюдения, представляет собой некоторое преобразование интересующих исследователя данных. При этом дополнительно возникает задача обращения этого преобразования. В работе рассмотрен случай, когда исходный вектор данных подвергается действию линейного однородного преобразователя. Такие ситуации типичны, например, в астрофизических и томографических приложениях.