О. Д. Борисенко, Р. К. Пастухов, С. Д. Кузнецов, “Создание виртуальных кластеров Apache Spark в облачных средах с использованием систем оркестрации”, Труды ИСП РАН, 2016, том 28, выпуск 6,страницы 111

Эта публикация цитируется в 1 статье

Создание виртуальных кластеров Apache Spark в облачных средах с использованием систем оркестрации

О. Д. Борисенко^a, Р. К. Пастухов^a, С. Д. Кузнецов^abc

^a Институт системного программирования РАН
^b Московский государственный университет имени М.В. Ломоносова
^c Московский физико-технический институт

Аннотация: Apache Spark является одним из наиболее производительных распределенных фреймворков для обработки больших данных в парадигме Map-Reduce. С распространением облачных технологий и предоставления ресурсов по запросу все более актуальной становится задача построения виртуальных вычислительных кластеров для конкретной задачи. В работе представлен краткий обзор разработанного решения для создания виртуальных кластеров Apache Spark в облачной среде Openstack и подведение итогов исследования о способах создания виртуальных кластеров Apache Spark в открытых облачных средах. Решение построено с использованием системы оркестрации Ansible. В работе будет проведено качественное сравнение разработанных в ИСП РАН подходов к решению задачи.

Ключевые слова: Apache Spark, Openstack, Amazon EC2, Map-Reduce, HDFS, виртуальные кластеры, облачные вычисления, Big Data, Apache Ignite.

DOI: 10.15514/ISPRAS-2016-28(6)-8