Аннотация:
Представление последовательности ДНК возможно в различном виде. Граф вариации один из самых точных методов, который позволяет работать с нетипичными участками и учитывать все их разнообразие. На основе этой структуры данных и метода полигенной оценки риска была построена система интерпретации ДНК. В результате был получен коэффициент корреляции между путем в графе, отвечающим за конкретную последовательность ДНК, и признаком. Затем мы сравнили его с коэффициентом, полученным аналогичным методом, но использующим представление последовательности с использованием эталонного генома. Такое сравнение помогло оценить эффективность представления в виде графа. После этого был построен модифицированный метод подсчета полигенной оценки на данных выравнивания инструмента vg, который также был сравнен с существующими методами. Модифицированный метод показал улучшение прогноза признака.
Ключевые слова:граф, представление генома, граф вариаций, HISAT2, vg, minimap2, GGP, геномный граф, PRS, полигенная оценка, полигенная оценка риска