RUS  ENG
Полная версия
ЖУРНАЛЫ // Компьютерные исследования и моделирование // Архив

Компьютерные исследования и моделирование, 2020, том 12, выпуск 6, страницы 1383–1395 (Mi crm855)

Эта публикация цитируется в 1 статье

АНАЛИЗ И МОДЕЛИРОВАНИЕ СЛОЖНЫХ ЖИВЫХ СИСТЕМ

Применение ансамбля нейросетей и методов статистической механики для предсказания связывания пептида с главным комплексом гистосовместимости

И. В. Гребёнкинa, А. Е. Алексеенкоb, Н. А. Гайворонскийa, М. Г. Игнатовb, А. М. Казённовb, Д. Козаковc, А. П. Кулагинa, Я. А. Холодовa

a Университет «Иннополис», Россия, 420500, г. Иннополис, ул. Университетская, д. 1
b Институт автоматизации проектирования РАН, Россия, 123056, г. Москва, ул. 2-я Брестcкая, д. 19/18
c Университет Стони Брук, США, г. Нью-Йорк, 11794, Stony Brook, 100 Nicolls Rd

Аннотация: Белки главного комплекса гистосовместимости (ГКГС) играют ключевую рольв работе адаптивной иммунной системы, и определение связывающихся с ними пептидов — важный шаг в разработке вакцин и понимании механизмов аутоиммунных заболеваний. На сегодняшний день существует ряд методов для предсказания связывания определенной аллели ГКГС с пептидом. Одним из лучших таких методов является NetMHCpan-4.0, основанный на ансамбле искусственных нейронных сетей. В данной работе представлена методология качественного улучшения архитектуры нейронной сети, лежащей в основе NetMHCpan-4.0. Предлагаемый метод использует технику построения ансамбля и добавляет в качестве входных данных оценку модели Поттса, взятой из статистической механики и являющейся обобщением модели Изинга. В общем случае модель отражает взаимодействие спинов в кристаллической решетке. Применительно к задаче белок-пептидного взаимодействия вместо спинов используются типы аминокислот, находящихся в кармане связывания. В предлагаемом методе модель Поттса используется для более всестороннего представления физической природы взаимодействия полипептидных цепей, входящих в состав комплекса. Для оценки взаимодействия комплекса «ГКГС + пептид» нами используется двумерная модель Поттса с 20 состояниями (соответствующими основным аминокислотам). Решая обратную задачу с использованием данных об экспериментально подтвержденных взаимодействующих парах, мы получаем значения параметров модели Поттса, которые затем применяем для оценки новой пары «ГКГС + пептид», и дополняем этим значением входные данные нейронной сети. Такой подход, в сочетании с техникой построения ансамбля, позволяет улучшить точность предсказания, по метрике положительной прогностической значимости (PPV), по сравнению с базовой моделью.

Ключевые слова: главный комплекс гистосовместимости, аффинность связывания, нейронная сеть, машинное обучение, модель Поттса.

УДК: 577.27

Поступила в редакцию: 10.08.2020
Исправленный вариант: 19.10.2020
Принята в печать: 29.10.2020

DOI: 10.20537/2076-7633-2020-12-6-1383-1395



© МИАН, 2024