Предсказа́ние ге́нов

Множественные информанты[править | править код]

bet	5/5
Sana	18.06.2023
Hajmi	42.39 Kb.
	#1582998

1 2 3 4 5

Bog'liq
Реферат на тему “Современные системы управления базами данных”

Множественные информанты[править | править код]

Программа TWINSCAN для поиска ортологичных генов учитывает только синтению человеческого и мышиного геномов. Такие программы, как N-SCAN и CONTRAST, позволяют совмещать данные из множества организмов. Использование множества источников данных приводит к значительному улучшению точности^[22].
Программа CONTRAST состоит из двух частей. Первая — классификатор, опознающий сайты сплайсинга, старт- и стоп-кодоны. Вторая часть строит окончательную модель при помощи машинного обучения, принимая на вход данные от первого классификатора и множественных выравниваний с другими геномами. Разделение задачи надвое позволяет снизить объём обучающей выборки и размер окна. Использование уже готового классификатора значительно сокращает время работы программы^[23].

Предсказание псевдогенов[править | править код]

Поиск псевдогенов — основывается на существующих ab initio методах и методах сравнительной геномики с добавлением специальных фильтров.
Пример такого фильтра — детектор потери функции, который ищет нонсенс мутации и сдвиги рамки считывания, нарушающие экспрессию функциональной последовательности ДНК^[24][25].
Также применяется фильтрация ДНК по разнице в статистических параметрах между генами и псевдогенами, как например меньшее число CpG-островков в псевдогенах. Некоторые искатели генов детектируют такие сигналы, как отсутствие интронов и поли(А)-хвостов^[26].
Для поиска псевдогенов в прокариотах применяется программа Psi-Fi (Ψ-Φ)^[27].

Метагеномное предсказание генов[править | править код]

Метагеномные программы делятся на те, что используют принципы ab initio (программа GLIMMER-MG^[28]) или сравнительную геномику (программа MEGAN5^[29]).
GLIMMER-MG — расширение GLIMMER, полагающееся в основном на подходе ab initio и использующее обучающую выборку из родственных организмов. Стратегия предсказания улучшена за счёт кластеризации генных данных по видам перед предсказанием. Кластеризация основана на техниках метагеномной филогенетической классификации. Примеры программ для кластеризации — Phym с интерполированными марковскими моделями и PhymmBL, пользующийся BLAST^[30].
В основе MEGAN5^[31] лежат методы сравнительной геномики. В этой программе применяется локальное выравнивание против базы известных последовательностей, но также и реализована классификация с использованием дополнительной информации о функции генов^[31].

Download 42.39 Kb.

Do'stlaringiz bilan baham:

1 2 3 4 5