RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическая биология и биоинформатика // Архив

Матем. биология и биоинформ., 2020, том 15, выпуск 1, страницы 4–19 (Mi mbb419)

Эта публикация цитируется в 2 статьях

Биоинформатика

Подход к отбору значимых признаков при решении биомедицинских задач бинарной классификации данных с микрочипов

И. Ю. Бойко, Д. С. Анисимов, Л. Л. Смолякова, М. А. Рязанов

Алтайский государственный университет, Барнаул, Россия

Аннотация: В ряде современных биомедицинских исследований, направленных на поиск методов ранней диагностики онкологических заболеваний, используются микрочипы, содержащие определенную биологическую информацию о пациентах. На основе этих данных происходит отнесение пациентов к одному из двух классов, соответствующих наличию и отсутствию у пациента некоторого диагноза. При решении данной задачи отбор значимых признаков является одним из этапов, оказывающих решающее влияние на качество классификации. В данной работе предлагается критерий отбора значимых признаков, основанный на использовании ledge-коэффициента корреляции, введенного ранее для оценки степени взаимосвязи числового и бинарного признаков. Для двух наборов данных с микрочипов приведены сравнительные примеры их бинарной классификации с использованием трех алгоритмов отбора признаков, трех методов уменьшения размерности, шести моделей классификации. Использование ledge-критерия отбора признаков позволило получить качество классификации, сравнимое с результатами использования распространенных методов отбора признаков, таких как: $t$-критерий, $U$-критерий. Для рассмотренного в работе набора данных с пептидных микрочипов ранее была выявлена эффективность применения метода проекции на латентные структуры. Использование этого метода в сочетании с отбором значимых признаков ledge-критерием позволило получить более высокий показатель качества классификации.

Ключевые слова: отбор признаков, ledge-коэффициент, бинарная классификация, микрочипы, ROC-кривая, метод проекции на латентные структуры.

Материал поступил в редакцию 18.07.2019, 15.01.2020, опубликован 30.01.2020

DOI: 10.17537/2020.15.4



© МИАН, 2024