Аннотация:
Ещё в 2002 была осознана необходимость создания общедоступного хранилища результатов молекулярно-биологических экспериментов по профилированию генной экспрессии. За прошедшее время было создано несколько таких хранилищ информации, необходимых для того, чтобы результаты гибридизации мРНК на основе микрочипов (молекулярный анализ при помощи чувствительной матрицы зондов), а также высокопроизводительного секвенирования мРНК можно было анализировать и сопоставлять друг с другом. Несмотря на это, данные, депонированные в таких хранилищах, могут быть неоднородными, даже если они относятся к одинаковому типу здоровых или патологически изменённых органов и тканей, и были исследованы на одинаковой платформе. В настоящей работе предложен новый метод анализа однородности экспрессионных данных на основе теста Стьюдента. При помощи вычислительных экспериментов мы показали преимущества нашего метода по затратам времени на обработку больших массивов данных, а также разработали метод интерпретации результатов применения теста Стьюдента. С использованием нового метода анализа данных были проведены другие исследования, позволяющие визуализировать общую картину генной экспрессии и сравнить между собой экспрессионные профили при разных болезнях, либо разных стадиях одной болезни.
Ключевые слова:генная экспрессия, профилирование мРНК, транскриптом, большие данные, репозитории общедоступных данных, тест Стьюдента, кластеризация.
УДК:
57.087.1
Материал поступил в редакцию 05.12.2017, опубликован 06.04.2018