RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2023, том 35, выпуск 4, страницы 93–108 (Mi tisp802)

Эта публикация цитируется в 1 статье

Анализ системы контроля доступа в гетерогенных системах больших данных

М. А. Полтавцева, М. О. Калинин

Санкт-Петербургский политехнический университет Петра Великого

Аннотация: Системы управления большими данными являются сегодня востребованными практически во всех отраслях, они же являются фундаментом для обучения искусственного интеллекта. Использование в системах больших данных гетерогенных полихранилищ привело к тому, что инструменты в рамках одной системы имеют различную грануляцию данных и модели контроля доступа. Согласование таких компонентов администратором безопасности и реализация общей политики доступа сегодня выполняются вручную. Это приводит к росту числа уязвимостей настройки, что, в свою очередь, служит частой причиной утечек данных. Анализ работ в области автоматизации и анализа контроля доступа в системах больших данных показывает отсутствие решений автоматизации для систем на основе полихранилищ. В данной работе ставится задача автоматизации анализа контроля доступа в системах управления большими данными. Авторы формулируют основное противоречие, заключающееся, с одной стороны, в требовании масштабируемости и гибкости контроля доступа, а с другой – в росте нагрузки на администратора безопасности, усугубленное использованием различных моделей данных и контроля доступа в компонентах системы. Для решения этой проблемы предлагается новый автоматизированный метод анализа политик безопасности, основанный на графовой модели обработки данных и позволяющий снизить число возможных уязвимостей, возникающих в результате некорректного администрирования систем big data. При проведении анализа в рамках предложенного метода используется модель жизненного цикла данных в системе, текущие настройки и желаемая политика безопасности. Использование двухпроходного анализа (от источников данных к получателям и обратно) позволяет решить две задачи: анализ системы контроля доступа на возможные уязвимости и проверку соблюдения корректности бизнес – логики. В работе приводится пример анализа политик безопасности системы управления большими данными с использованием разработанного программного прототипа, анализируются полученные результаты.

Ключевые слова: информационная безопасность, большие данные, полихранилища, поли-базы данных, контроль доступа, жизненный цикл данных, моделирование обработки данных, политика безопасности

DOI: 10.15514/ISPRAS-2023-35(4)-4



© МИАН, 2024