Предсказа́ние ге́нов


Другие сигналы[править | править код]


Download 42.39 Kb.
bet3/5
Sana18.06.2023
Hajmi42.39 Kb.
#1582998
1   2   3   4   5
Bog'liq
Реферат на тему “Современные системы управления базами данных”

Другие сигналы[править | править код]


Для предсказания генов используются статистики k-меров[en], GC-состав, равномерность, энтропия участков ДНК, длина рамок считывания, наборы сайтов связывания рибосом, а также промоторных, экзонно-интронных сайтов и сайтов сплайсинга, фрактальная размерность, Фурье-преобразование закодированной цифрами ДНК и параметры Z-кривой[en][12].
Качество предсказаний можно улучшить, применяя не только непосредственно детектируемые сигналы. Например, вторичная структура РНК может помочь с поиском сайтов сплайсинга и других регуляторных мотивов.[13][14][15][16][17]

Нейронные сети[править | править код]


См. также: Искусственная нейронная сеть
Пример такой сети — нейронная сеть, определяющая положения сайтов сплайсинга в заданной последовательности ДНК. В этой сети применяется метод скользящего окна, при котором из общей последовательности извлекаются пересекающиеся подпоследовательности (окна) с некоторым шагом. Полученный от каждого окна сигнал сглаживается и фильтруется, после чего для каждого нуклеотида определяется вероятность того, что он входит в сайт сплайсинга. Больший размер окна позволяет повысить точность предсказания, но увеличивает время вычислений. В сеть не было заложено никаких априорных знаний, но в результате обучения на сайтах 16965 генов специфичность и чувствительность распознавания превысили 80 %[18].

Совмещённый подход[править | править код]


Совмещенный подход является наиболее широко используемым, так как он сочетает лучшее из эмпирического и неэмпирического методов, дополняя результаты ab initio внешней информацией. Программы MAKER[19] и MAKER-P могут быть применены для аннотирования генов во вновь собранных геномах, обновления или объединения устаревших аннотаций в свете новых данных. MAKER и MAKER-P могут быстро аннотировать геномы любого размера и масштабировать в соответствии с доступными вычислительными ресурсами[20].
MAKER и MAKER-P комментируют и маскируют повторяющиеся элементы в геноме и сопоставляют данные о белках и РНК со сборкой с учетом сплайсинга для точной идентификации сайтов сплайсинга. Они также запускают несколько предсказателей генов ab initio, сравнивают все предсказанные генные модели с данными о выравнивании РНК и белков, а затем пересматривают модели генов ab initio в свете этих данных. Модели генов с наилучшей поддержкой выбираются с использованием показателя качества, называемого расстояние редактирования аннотации (англ. annotation edition distance, AED)[20].
MAKER и MAKER-P являются высокопараллельными приложениями с поддержкой интерфейса передачи сообщений (англ. message раss interface, MPI); это позволяет им эффективно использовать несколько процессоров и аннотировать крупные геномы млекопитающих и растений буквально за несколько часов[20].
MAKER был разработан как простой в использовании конвейер аннотаций для геномов модельных организмов. Главная цель MAKER состояла в том, чтобы дать возможность небольшим независимым исследовательским группам без обширного опыта или ресурсов в области биоинформатики комментировать геномы[20].
MAKER 2 является обратно совместимым расширением, улучшил возможности генного поиска; предлагая динамические средства для поиска генов и предоставляя новые средства для контроля качества с использованием AED, а также средства для обновления устаревших аннотаций в свете новых данных о транскриптах и белках[20].
MAKER-P предоставляет средства для аннотирования сложных геномов растений, а также для автоматического пересмотра, контроля качества и управления существующими аннотациями генома. MAKER-P также предоставляет средства для аннотации генов некодирующих РНК и аннотации псевдогенов. MAKER-P значительно быстрее, чем другие конвейеры аннотирования генома, включая оригинальный MAKER2, что позволяет масштабировать его даже до самых крупных геномов растений[20].

Download 42.39 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling