RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическая биология и биоинформатика // Архив

Матем. биология и биоинформ., 2020, том 15, выпуск 2, страницы 429–440 (Mi mbb440)

Биоинформатика

Conserved peptides recognition by ensemble of neural networks for mining protein data – LPMO case study

[Распознавание консервативных пептидов ансамблем нейронных сетей для глубинного анализа белковых данных на примере LPMO]

G. S. Dotsenko, A. S. Dotsenko

Federal Research Center "Fundamentals of Biotechnology" of the Russian Academy of Sciences, Moscow, Russian Federation

Аннотация: Глубинный анализ белковых данных – это новое перспективное направление современной биоинформатики. В этой работе мы предложили новый подход для глубинного анализа белковых данных – распознавание консервативных пептидов ансамблем нейронных сетей (CPRENN). Этот подход был применён для поиска литических полисахаридмонооксигеназ (LPMO) в протеомах 19 аскомицетов, 18 базидиомицетов и 18 бактерий. LPMO – это недавно открытые ферменты, и их поиск имеет большое значение для биотехнологии лигноцеллюлозных материалов. CPRENN был сопоставлен с двумя стандартными биоинформатическими методами для глубинного анализа белковых данных – поиском по скрытым марковским моделям (HMM, программа HMMER) и распознаванием пептидных мотивов (программа PPR совместно с приложением Hotpep). Максимальное число аминокислотных последовательностей гипотетических LPMO было обнаружено с помощью программы HMMER. Метод HMM оказался более чувствительным для поиска LPMO, чем распознавание консервативных пептидов. В целом, с помощью CPRENN было найдено 76 %, 67 % и 65 % гипотетических аскомицетных, базидиомицетных и бактериальных LPMO, обнаруженных HMMER, соответственно. Для AA9, AA10 и AA11 семей, содержащих основную часть всех LPMO в базе данных CAZy, с помощью CPRENN и PPR + Hotpep было найдено 69–98 % и 62–95 % аминокислотных последовательностей, обнаруженных HMMER, соответственно. В отличие от PPR + Hotpep, CPRENN обладал идеальной точностью и обеспечивал более полный поиск базидиомицетных и бактериальных LPMO.

Ключевые слова: глубинный анализ белковых данных, распознавание консервативных пептидов, ансамбль нейронных сетей, литические полисахаридмонооксигеназы.

Материал поступил в редакцию 24.09.2020, 28.11.2020, опубликован 22.12.2020

Язык публикации: английский

DOI: 10.17537/2020.15.429



© МИАН, 2024