Лекция. Предсказание структур генов эукариотических организмов. Методы прогнозирования генных структур.


Download 447.22 Kb.
bet3/7
Sana16.03.2023
Hajmi447.22 Kb.
#1278888
TuriЛекция
1   2   3   4   5   6   7
Bog'liq
6-7 Лекция. Предсказание структур генов эукариотических организмов. Методы прогнозирования генных структур.

Это, однако, также является большим преимуществом этого подхода, так как он способен предсказывать быстро развивающиеся и видоспецифичные гены. У прокариот гены содержат характерные и хорошо изученные консенсусные элементы -35 и -10 (Прибнов-бокс), которые легко обнаружить, а также сайты связывания транскрипционных факторов. Кроме того, белок-кодирующие гены состоит из одной непрерывной рамки считывания длиной от сотен до нескольких тысяч пар оснований, заканчивающихся стоп-кодоном.

В случайных последовательностях стоп-кодоны встречаются гораздо чаще (3 из 64 кодонов — стоп-кодоны, то есть в среднем 1 стоп-кодон на 20—25 кодонов, или 60—75 нуклеотидов), поэтому наличие длинных рамок считывания — уже признак гена. Прочие статистические параметры белок-кодирующей ДНК также легко заметны на последовательностях такой длины. Как следствие, системы предсказания прокариотических генов действуют весьма прямолинейно и обладают высокой точностью.

У эукариот из-за сплайсинга белок-кодирующие последовательности ДНК (экзоны) прерываются некодирующими участками (интронами). Сайты сплайсинга — ещё один сигнал для распознавания генов. Типичный белок-кодирущий ген человека может быть разделён на десяток экзонов, длина каждого из которых обычно составляет 100—200 нуклеотидов. На таких коротких участках гораздо сложнее заметить отличия белок-кодирующей ДНК от случайной.

Программы для поиска генов как у про-, так и у эукариот обычно используют скрытые марковские модели (НММ) и машинное обучение, чтобы объединить информацию от различных сигналов и выявленных закономерностей. GLIMMER — широко используемая и высокоточная система поиска генов в прокариотах, GeneMark — ещё одна популярная система. В сравнении с прокариотическими, неэмперический поиск генов эукариот достиг более скромных результатов.

Лучшие программы для эукариот — GENSCAN и geneid. SNAP, как и Genscan, основана на НММ и является попыткой создать универсальный искатель генов, который может работать на геноме, в котором ему не была дана обучающая выборка. В других программах, как например, mSplicer, CONTRAST, или mGene применяется машинное обучение и метод опорных векторов. Они строят различающую модель с применением методов НММ, SVM или марсковских случайных полей (от англ. Conditional random field, CRF) для составления функции вероятности наличия гена.


Download 447.22 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling