194-guruh talabasi Nurullayev Davronning Bioinformatika fanidan


Download 1.08 Mb.
bet8/10
Sana17.06.2023
Hajmi1.08 Mb.
#1552831
1   2   3   4   5   6   7   8   9   10
Bog'liq
Biologik ketma-ketliklarning juftlik taqqoslanishi

2.2.2-rasm.
BLAST asosidagi va global moslashtirish usullaridan foydalangan holda Ebola virusi ( NC_002549 ) va Taï Forest virusi ( NC_014372 ) genomlari ketma-ketligi oʻrtasidagi juftlik moslashuvining nuqta matritsasi va matn koʻrinishi. Ro'yxatda keltirilgan barcha virus turlari nomlari eng so'nggi ICTV turlari nomlarini aks ettirmaydi.


2.3. Turli DNK yoki oqsil ketma-ketligi o'rtasidagi funktsional va evolyutsion munosabatlarni o'rganish.

Biologik ketma-ketliklar nukleotidlar yoki aminokislotalarning ketma-ketligini bildiradi. Nuklein kislotalar (DNK va RNK) to'rt nukleotid asoslaridan tashkil topgan polimerlar bo'lib, DNK uchun adenin (A), sitozin (C), guanin (G) va timin (T) va RNKdagi timin o'rniga Uratsil (U). Proteinlar yigirma aminokislotalarning ketma-ketligidan tashkil topgan polimerlardir. Biologik ketma-ketlikni tahlil qilish usullari DNK, RNK va oqsil ketma-ketliklarini bioinformatika tadqiqotlarida hal qiluvchi ahamiyatga ega bo'lgan boshqa ketma-ketliklar bilan taqqoslash, moslashtirish va indekslash orqali tahlil qiladi. Biologiyada ketma-ketlikni taqqoslash evolyutsion munosabatlarni tushunish va oqsil tuzilishi va funktsiyasini bashorat qilish uchun zarurdir. U yangi aniqlangan ketma-ketlikni strukturaviy va funktsional tahlil qilish uchun asos bo'ladi. Ketma-ketlikni moslashtirish barcha tirik organizmlarning ierarxik kelib chiqishiga asoslanadi. 


Bioinformatikada, ketma-ketlikni tekislash ketma-ketlik o'xshashlik darajasini tushuntiruvchi maksimal identifikatsiya darajasini olish uchun biologik ketma-ketliklarni qatorlashni nazarda tutadi. Gomologik ketma-ketliklar umumiy ajdodga ega bo'lganlardir, shuning uchun ikkita ketma-ketlik o'rtasidagi o'xshashlik darajasi homologiya imkoniyatini belgilaydi. Umuman olganda, biologik ketma-ketliklar uchun ikki xil hizalanish mavjud: mahalliy hizalanish, bu erda ketma-ketliklarning faqat qismlari tekislanadi va global hizalanish, bu erda ketma-ketliklarning butun uzunligi tekislanadi. shuning uchun ikkita ketma-ketlik o'rtasidagi o'xshashlik darajasi homologiya imkoniyatini belgilaydi. Umuman olganda, biologik ketma-ketliklar uchun ikki xil hizalanish mavjud: mahalliy hizalanish, bu erda ketma-ketliklarning faqat qismlari tekislanadi va global hizalanish, bu erda ketma-ketliklarning butun uzunligi tekislanadi. shuning uchun ikkita ketma-ketlik o'rtasidagi o'xshashlik darajasi homologiya imkoniyatini belgilaydi.
Umuman olganda, biologik ketma-ketliklar uchun ikki xil hizalanish mavjud: mahalliy hizalama, bu erda ketma-ketliklarning faqat qismlari tekislanadi va global hizalanish, bu erda ketma-ketliklarning butun uzunligi tekislanadi.

Global Alignment vositalariga misollar
EMBOSS Needle, Needleman-Wunch
Mahalliy moslashtirish vositalariga misollar
PORTLASH, BO'LDIRISH Suv, LALIGN
Juftlik ketma-ketlikni moslashtirish usullari ikkita biologik ketma-ketlikning eng yaxshi mos keladigan global yoki mahalliy moslashuvini aniqlaydi. U genom yig'ilishi kabi keng biologik ilovalarga ega, bu erda turli xil DNK ketma-ketliklari DNK paydo bo'lgan asl xromosoma tasvirini yaratish uchun birlashtiriladi. Ikkilik taqqoslash ikkita ketma-ketlik o'rtasida saqlangan hududlarni topadi. Juftlik ketma-ketligining ba'zi ilovalari o'z ichiga oladi:

  • Gomologik ketma-ketliklarni aniqlash.

  • Biologik ketma-ketlikda umumiy domenni topish.

  • Protein/nuklein kislotalarda takrorlangan hududlarni aniqlash.

  • Aminokislotalardagi muhim xususiyatlarni aniqlash, masalan, katalitik domenlar, disulfid ko'priklar va boshqalar.

  • Muayyan gen va uning mahsulotlarini evristik usulda taqqoslash.

  • Profil va HMM (Yashirin Markov modeli) yasash

  • Proteinning 3D tuzilishini bashorat qilish

  • Daraxtlarning filogenetik tahlili

  • Pairwise Sequence Alignment bo'yicha baholash

Biologik ketma-ketlikni tahlil qilish uchun e'tiborga olish kerak bo'lgan omillardan biri - kiritish (ketma-ketlikdagi qo'shimcha qoldiqlar) va o'chirish (ketma-ketlikdagi etishmayotgan qoldiqlar).
Misol uchun, quyidagi ketma-ketlikni ko'rib chiqing:

Bu yerda 1 va 2 ketma-ketlikda bir xil aminokislota qoldiqlari uchinchi qatorda nomlari (GCP va P) bilan, har xil bo'lgan joy esa x bilan belgilanadi. Ikkinchi ketma-ketlikdagi sistein © birinchi ketma-ketlikda tire (-) bilan belgilangan mos keluvchiga o'xshamaydi. Identifikatsiya ulushi 30% (4/12). Hizalama balli quyidagicha hisoblanadi:
(Ball) S= mos kelishlar soni - nomuvofiqliklar soni = 4 - 12 =-8
Muvofiqlik sifatida ijobiy qiymat, mos kelmaslik uchun esa salbiy qiymat beriladi. Ketma-ketlikni tekislashdagi bo'shliq ikkinchi ketma-ketlikdagi ketma-ketlik yoki kiritishdan o'chirilgan qoldiqlarni aniqlaydi.

R dasturlash yordamida oqsil yoki DNK ketma-ketligini juftlik ketma-ketligi bilan moslashtirish
Biologik so'rovlar ketma-ketligi o'rtasidagi homologiyani aniqlash uchun ACANA, ALLALIGN, SIM, GAP, NAP, LAP va boshqalar kabi turli xil juftlik ketma-ketligini moslashtirish vositalari mavjud. Ushbu tajribada statistik R dasturlash tiliga asoslangan Bioconductor loyihasining Biostring to'plami qo'llanildi. Bu turli xil genomik ma'lumotlarni tahlil qilish uchun to'liq hisoblash va statistik yondashuvni ta'minlaydi. Biostring to'plamida katta biologik ketma-ketliklarni tez manipulyatsiya qilish uchun qatorlarni moslashtirish algoritmlari mavjud.9

XULOSA.

Xulosa qilib shuni aytish mumkinki, PASC vositasi NCBIda umumiy ma'lumotlar bazalarida mavjud bo'lgan barcha to'liq genom ketma-ketliklarida ikkita juft tekislash usulidan foydalangan holda yaratilgan va Filoviridae oilasi uchun mavjud.. BLAST asosidagi tekislash natijasi filoviruslarning genom ketma-ketliklari orasidagi haqiqiy o'xshashlikni yaxshiroq ifodalaydi va demarkatsiya mezonlarini belgilash uchun tavsiya etiladi, bu turlar uchun 64% dan 77% gacha va avlodlar uchun 41% dan 50% gacha. Yuqori divergentsiyaga ega bo'lgan ko'proq genom ketma-ketligi mavjud bo'lganda, bu chegaralar torroq diapazonlarga yoki hatto aniq foizga o'zgaradi. Bu chegaralar bu erda qo'llaniladigan usul bilan maxsus bog'langan, shuning uchun boshqa algoritmlar yordamida hisoblangan identifikatorlar uchun havola sifatida ishlatilmasligi kerak. Ushbu vosita filoviruslarning yangi genom ketma-ketligini ma'lumotlar bazasidagi mavjudlari bilan solishtirishi va ularning taksonomik tasnifini taklif qilishi mumkin.


Tashqi (yoki yangi) genomlarni maʼlumotlar bazasidagi mavjud ketma-ketliklar bilan solishtirish uchun foydalanuvchi GenBank Access/GI raqamlaridan foydalangan holda, FASTA formatida xom maʼlumotlarni kiritish yoki ketma-ketlikni yuklash orqali “Sequence:” maydonida soʻrov genomlarini belgilashi mumkin. "Browse" tugmasini bosgandan so'ng faylni oching. Bitta taqdimotga 25 tagacha ketma-ketlik qo'shilishi mumkin. Ketma-ketliklar topshirilgandan so'ng, PASC foydalanuvchi tomonidan taqdim etilgan genomlar va oiladagi mavjud genom ketma-ketliklari o'rtasidagi juftlik identifikatorlarini hisoblab chiqadi. PASC ushbu kirish genomi va (1) qolgan kirish genomlari (agar bir nechta bo'lsa) va (2) mavjud genomlarga eng yaqin mos keladigan 5 dan 10 gacha bo'lgan ikkita identifikatsiya ro'yxatini ishlab chiqaradi. oila. Identifikatsiyani taqsimlash jadvali hozirda tanlangan genomni boshqa rang bilan tasvirlaydi.



Download 1.08 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling