Предсказа́ние ге́нов


Множественные информанты[править | править код]


Download 42.39 Kb.
bet5/5
Sana18.06.2023
Hajmi42.39 Kb.
#1582998
1   2   3   4   5
Bog'liq
Реферат на тему “Современные системы управления базами данных”

Множественные информанты[править | править код]


Программа TWINSCAN для поиска ортологичных генов учитывает только синтению человеческого и мышиного геномов. Такие программы, как N-SCAN и CONTRAST, позволяют совмещать данные из множества организмов. Использование множества источников данных приводит к значительному улучшению точности[22].
Программа CONTRAST состоит из двух частей. Первая — классификатор, опознающий сайты сплайсинга, старт- и стоп-кодоны. Вторая часть строит окончательную модель при помощи машинного обучения, принимая на вход данные от первого классификатора и множественных выравниваний с другими геномами. Разделение задачи надвое позволяет снизить объём обучающей выборки и размер окна. Использование уже готового классификатора значительно сокращает время работы программы[23].

Предсказание псевдогенов[править | править код]


Поиск псевдогенов — основывается на существующих ab initio методах и методах сравнительной геномики с добавлением специальных фильтров.
Пример такого фильтра — детектор потери функции, который ищет нонсенс мутации и сдвиги рамки считывания, нарушающие экспрессию функциональной последовательности ДНК[24][25].
Также применяется фильтрация ДНК по разнице в статистических параметрах между генами и псевдогенами, как например меньшее число CpG-островков в псевдогенах. Некоторые искатели генов детектируют такие сигналы, как отсутствие интронов и поли(А)-хвостов[26].
Для поиска псевдогенов в прокариотах применяется программа Psi-Fi (Ψ-Φ)[27].

Метагеномное предсказание генов[править | править код]


Метагеномные программы делятся на те, что используют принципы ab initio (программа GLIMMER-MG[28]) или сравнительную геномику (программа MEGAN5[29]).
GLIMMER-MG — расширение GLIMMER, полагающееся в основном на подходе ab initio и использующее обучающую выборку из родственных организмов. Стратегия предсказания улучшена за счёт кластеризации генных данных по видам перед предсказанием. Кластеризация основана на техниках метагеномной филогенетической классификации. Примеры программ для кластеризации — Phym с интерполированными марковскими моделями и PhymmBL, пользующийся BLAST[30].
В основе MEGAN5[31] лежат методы сравнительной геномики. В этой программе применяется локальное выравнивание против базы известных последовательностей, но также и реализована классификация с использованием дополнительной информации о функции генов[31].
Download 42.39 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling