RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическая биология и биоинформатика // Архив

Матем. биология и биоинформ., 2018, том 13, выпуск Suppl., страницы t1–t16 (Mi mbb359)

Эта публикация цитируется в 6 статьях

Переводы опубликованных статей

Big Data in bioinformatics

[Большие данные в биоинформатике]

N. N. Nazipovaa, E. A. Isaevb, V. V. Kornilovb, D. V. Pervukhinb, A. A. Morozovac, A. A. Gorbunovb, M. N. Ustinina

a Institute of Mathematical Problems of Biology RAS - the Branch of Keldysh Institute of Applied Mathematics of Russian Academy of Sciences
b National Research University "Higher School of Economics"
c The Union of Enterprises the Central Scientific and Production Association "CASCADE"

Аннотация: Секвенирование человеческого генома началось в 1994 году. Понадобилось 10 лет работы многих научных коллективов для того, чтобы получить черновую последовательность ДНК человека. Современные технологии секвенирования позволяют получать геном конкретного человека за несколько дней. Обсуждаются успехи современной биоинформатики, связанные с появлением высокопроизводительных платформ секвенирования, которые не только способствовали расширению возможностей различных направлений биологии и других смежных наук, но и породили феномен больших данных. Обосновывается необходимость разработки новых технологий и методов для организации хранения, управления, анализа и визуализации больших данных. Современная биоинформатика столкнулась не только с проблемой больших данных, но и с огромным разнообразием методов обработки и представления, одновременным существованием различных программных средств и форматов данных. Обсуждаются пути решения возникших проблем, в частности путем использования наработок работы с большими данными из других областей современной жизни, таких как сетевой анализ и анализ деловых данных. Новые системы управления базами данных, отличные от реляционных, помогут решить проблему хранения больших данных и обеспечения приемлемого времени выполнения поисковых запросов. Новые технологии программирования, такие, как обобщенное программирование и визуальное программирование призваны решить проблему разнообразия форматов геномных данных и обеспечить возможность оперативного создания собственных скриптов для обработки данных.

Ключевые слова: большие данные, Big Data, NGS, секвенирование генома, IT-технологии, биоинформатика, обобщенное программирование, визуальное программирование, нереляционные системы управления базами данных, NoSQL системы, Hadoop, MapReduce.

УДК: 004.9:004.9:004.8:577.21

Материал поступил в редакцию 16.03.2018, опубликован 03.04.2018

Язык публикации: английский

DOI: 10.17537/2018.13.t1



© МИАН, 2024