RUS  ENG
Полная версия
ЖУРНАЛЫ // Computational nanotechnology // Архив

Comp. nanotechnol., 2025, том 12, выпуск 1, страницы 26–33 (Mi cn536)

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ТЕЛЕКОММУНИКАЦИИ

Сравнительный анализ систем хранения данных HDFS и Apache Ozone

К. О. Иевлев, М. Г. Городничев

Московский технический университет связи и информатики (МТУСИ)

Аннотация: За последние десятилетия значительно выросло не только количество цифровых данных в мире, но и способов их использования. Пионером и долгое время синонимом платформы для хранения и обработки больших данных являлась экосистема Hadoop, которая и по сей день активно используется во множестве крупнейших компаний. Однако, за почти 20 лет, прошедших с первого релиза Hadoop, был выявлен ряд существенных недостатков, такие как «проблема маленьких файлов» и неравномерное использование ресурсов кластеров. Во многих коммерческий и исследовательских организациях встает вопрос о модернизации стека работы с данными для повышения утилизации ресурсов и расширения возможностей для эффективной работы с данными. Цель данной работы – продемонстрировать достоинства и недостатки хранилища данных нового поколения – Apache Ozone и сделать вывод о готовности технологии для полноценной замены распределенной файловой системы Hadoop (HDFS).

Ключевые слова: хранение больших данных, распределенные файловые системы, объектное хранилище, S3, Apache Hadoop, Apache Ozone.

УДК: 004.624

DOI: 10.33693/2313-223X-2025-12-1-26-33



© МИАН, 2025