RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическая биология и биоинформатика // Архив

Матем. биология и биоинформ., 2017, том 12, выпуск 2, страницы 435–445 (Mi mbb304)

Эта публикация цитируется в 2 статьях

Биоинформатика

Анализ многомерных данных пептидных микрочипов с использованием метода проекции на латентные структуры

Д. С. Анисимовa, С. В. Подлесныхa, Е. А. Колосоваa, Д. Н. Щербаковa, В. Д. Петроваb, С. А. Джонстонc, А. Ф. Лазаревb, Н. М. Оскорбинd, А. И. Шаповалac, М. А. Рязановa

a Российско-американский противораковый центр, Алтайский государственный университет, Барнаул, Россия
b Алтайский филиал РОНЦ им. Н.Н. Блохина, Барнаул, Россия
c Центр инноваций в медицине, Институт биодизайна, Университет штата Аризона, Темпи, Аризона, США
d Факультет математики и информационных технологий, Алтайский государственный университет, Барнаул, Россия

Аннотация: В настоящее время в качестве аналитической системы в различных медико-биологических исследованиях применяются биологические микрочипы, содержащие нуклеотиды, белки, пептиды, гликаны и другие биологические молекулы. Современные микрочипы активно модифицируются, увеличивается количество и плотность иммобилизированных молекул. Обработка больших массивов данных, полученных с помощью микрочипов, требует оптимизации алгоритмов их анализа. Данные получение на пептидных микрочипах имеют некоторые особенности и требует применения нестандартных методов статистического анализа. В настоящей работе представлены результаты анализа репертуара антител в сыворотках пациентов с диагнозом раком молочной железы, полученных с помощью микрочипов, содержащих 330 тысяч пептидов. Исследование методов уменьшения размерности, в частности, проекционных методов и методов отбора информативных признаков показало, что метод проекции на латентные структуры позволяет выявить эффективную размерность данных, уменьшить эффект переобучения модели и улучшить качество распознавания объектов. Точность результатов эксперимента оценена при помощи ROC-кривой, и наилучшее качество достигнуто с использованием трёх латентных структур без предварительной нормализации и с использованием всех пептидов.

Ключевые слова: микрочипы, пептиды, нормализация, латентные переменные, кластеризация, ROC-кривая, метод проекции на латентные структуры.

УДК: 57.087

Материал поступил в редакцию 04.07.2017, опубликован 29.11.2017

DOI: 10.17537/2017.12.435



© МИАН, 2024