RUS  ENG
Полная версия
ЖУРНАЛЫ // Компьютерные исследования и моделирование // Архив

Компьютерные исследования и моделирование, 2013, том 5, выпуск 2, страницы 131–140 (Mi crm386)

МАТЕМАТИЧЕСКИЕ ОСНОВЫ И ЧИСЛЕННЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ

О разложении матриц при помощи метода стохастического градиентного спуска в приложении к задаче направляемой классификации микрочипов

В. Н. Никулин

Вятский государственный университет, ф-т экономики и менеджмента, кафедра ММЭ, Россия, 610000, г. Киров, ул. Московская, д. 36, Тел.: (8332) 64–48–16

Аннотация: Многомерные данные, при использовании значительно большего количества признаков относительно меньшего числа наблюдений, порождают хорошо известную проблему переопределённой задачи. В связи с этим, представляется целесообразным описание данных в терминах меньшего числа мета-признаков, которые вычисляются при помощи так называемых матричных факторизаций. Такие факторизации способствуют уменьшению случайного шума при сохранении наиболее существенной информации. Три новых и взаимосвязанных метода предложены в этой статье: 1) факторизационный механизм градиентного спуска с двумя (согласно размерности микрочипа) гибкими и адаптируемыми параметрами обучения, включая явные формулы их автоматического пересчета, 2) непараметрический критерий для отбора количества факторов, и 3) неотрицательная модификация градиентной факторизации, которая не требует дополнительных вычислительных затрат в сравнении с базовой моделью. Мы иллюстрируем эффективность предложенных методов в приложении к задаче направляемой классификации данных в области биоинформатики.

Ключевые слова: матричная факторизация, ненаправляемое обучение, количество факторов, непараметрический критерий, неотрицательность, оставить одного извне, классификация.

УДК: 004.9

Поступила в редакцию: 18.03.2013
Исправленный вариант: 05.04.2013

DOI: 10.20537/2076-7633-2013-5-2-131-140



© МИАН, 2024