6- amaliy mashg‘ulot mavzu: blast dasturi yordamida nukleotid ketma-ketliklarini solishtirish Dars maqsadi
Download 196.54 Kb. Pdf ko'rish
|
6- AMALIY MASHG‘ULOT
- Bu sahifa navigatsiya:
- Kerakli jihozlar
- BLAST nukleotidlarining ketma-ketligi dasturi.
- Nazorat savollari
6- AMALIY MASHG‘ULOT Mavzu: BLAST dasturi yordamida nukleotid ketma-ketliklarini solishtirish Dars maqsadi: Talabalarga BLAST dasturi yordamida nukleotid ketma- ketliklarini solishtirish bo’yicha amaliy ko’rsatmalar va tushunchalar berish. Kerakli jihozlar: Kompyuter va uning dasturlari, internet tarmog’i, videoproyektor. Ishning mazmuni: BLAST (Berkeley Lazy Abstraction Software Verification Tool) - bu C tilini namunaviy tekshirish dasturi. BLAST (Basic Basic Alignment Search Tool) - asosiy tuzilish (ketma-ketlik) yoki uning bo'lagi ma'lum bo'lgan oqsillar yoki nuklein kislotalarning homologlarini qidirishda foydalaniladigan kompyuter dasturlari oilasi. BLAST-dan foydalanib, tadqiqotchi o'z ketma-ketligini ma'lumotlar bazasidagi ketma-ketliklar bilan taqqoslashi va taxmin qilinayotgan homologlarning ketma-ketligini topishi mumkin. Bu molekulyar biologlar, bioinformatika, sistematikalar uchun eng muhim vositadir. Blast oynasi BLAST nukleotidlarining ketma-ketligi dasturi. Belgilanmaganga o'xshash oqsillarni kodlovchi genlarning aniqlanmagan genomlarini qidiringE. coli GlmS ga o'xshash oqsillarni kodlovchi genlarni qidirish amalga oshirildi. Qidiruv quyidagi organizmlarning aniqlanmagan genomlari bo'yicha olib borildi: Pseudomonas aeruginosa, Pasteurella multocida va Vibrio vabo. NCBI Entrez taksonomiyasining ma'lumotlariga ko'ra, bu organizmlarning barchasi E. colining juda yaqin qarindoshlari bo'lib, ular bir xil Gammaproteobakteriyalar sinfiga kiradi. Format dasturi yordamida qidiruvni amalga oshirishdan oldin har bir genom uchun indeksli fayllar, shuningdek uchta genom uchun indeksli fayllar alohida yaratildi. Ikkala holatda ham dastur nhr, nin va nsq kengaytmali uchta faylni yaratdi. Nsq kengaytmali fayl (nukleotidlar ketma-ketligi) 4 marta siqilgan nukleotidlar ketma-ketligi to'g'risidagi ma'lumotlarni o'z ichiga oladi. Ushbu fayl boshqa ikkalasiga qaraganda ancha katta. Nhr va ninali fayllar (nukleotid indekslari) yordamchi bo'lib, mos ravishda to'liq genomni tashkil etuvchi yozuvlar sarlavhalarini va indekslarning ro'yxatini o'z ichiga oladi (formatdb dasturi uchun hujjatlarni ko'ring). Qidiruvni amalga oshirish uchun BLAST to'plamidagi TBLASTN dasturidan foydalanildi, u oltita freymdagi tarjima mahsuloti kirish oqsillari ketma-ketligiga o'xshash nukleotidlar ketma-ketliklarini aniqlash uchun ishlab chiqilgan. Nukleotid Blast oynasi Elektron qiymatning chegaraviy qiymati 0,01 ga teng tanlangan. Qidiruv natijalari jadvalda keltirilgan. Nukleotidning ketma-ketligini taqqoslaganda (2) formula bilan aniqlanadi. Uzunligi m o'rganilgan ketma-ketlikni ko'plab ma'lumotlar bazalari ketma-ketligi bilan taqqoslash ikki nuqtaga asoslanishi mumkin. Birinchi nuqta, ma'lumotlar bazasining barcha ketma-ketliklari o'rganilayotganga o'xshashdir. Bu ma'lumotlar bazasida mavjud bo'lgan qisqa ketma-ketlik bilan hizalanish uchun E qiymatini uzun ketma-ketlik bilan tekislash uchun E qiymatiga tenglashtirish kerakligini anglatadi. Ma'lumotlar bazasidan E qiymatini hisoblash uchun olingan E qiymatini undagi ketma-ketliklar soniga juft-juft taqqoslash orqali ko'paytirish kerak. Ikkinchi nuqta, o'rganilgan ketma-ketlik uzoq ketma-ketliklarga qaraganda qisqaroqroqqa o'xshaydi, chunki ikkinchisi ko'pincha turli qismlardan iborat (ko'p oqsillar domenlardan iborat). Agar o'xshashlik ehtimolligi ketma-ketlik uzunligiga mutanosib deb hisoblasak, n uzunlikdagi ma'lumotlar bazasi uchun E ning juft qiymatini N / n ga ko'paytirish kerak, bu erda N - bazadagi aminokislotalar yoki nukleotidlarning umumiy uzunligi. BLAST dasturlari asosan ushbu yondashuvdan ma'lumotlar bazasidan E qiymatlarini hisoblashda foydalanadilar. Nazariy jihatdan, mahalliy moslashtirish har qanday nukleotid yoki aminokislotalarning hizalanadigan ketma-ketligidan boshlanishi mumkin. Biroq, GES, qoida tariqasida, ketma-ketlikning chetiga (boshiga yoki oxiriga) yaqin boshlamaydi. Bunday chekka effektni tuzatish uchun ketma-ketlikning samarali uzunligini hisoblash kerak. 200 dan ortiq qoldiq bo'lsa, chekka effekti neytrallanadi. BLASTN AC-ni chiqarishda bu yozuv AE004967. AE004967 yozuvi 2006 yil 12 iyulda AE004091 bilan almashtirildi. Shubhasiz, P. aeruginosa genom yozuvlari EMBL-ning oldingi versiyalaridan olingan. EMBL-ning SRS-qidiruvi EMBL-ning 87-versiyasida AE004967-ni topdi. CDS koordinata qiymatlari topilgan yozuvdan olinadi. Query: 1460 tgaaagagatctcttacattcacgctgaagcctacgctgctggcgaactgaaacacggtc 1519 ||||||||||||||||||| ||||| |||||||| || || ||||| || || || || | Sbjct: 4535 tgaaagagatctcttacatccacgcagaagcctatgcagcgggcgagctaaagcatggcc 4594 Query: 1520 cgctggcgctaattgatgccgatatgccggttattgttgttgcaccgaacaacgaattgc 1579 | ||||| |||||||||| |||||||| || |||| |||||||| | ||| ||| || Sbjct: 4595 cattggcgttaattgatgcggatatgccagtggttgtggttgcaccaagcaatgaactgt 4654 Query: 1580 tggaaaaactgaaatccaacattgaagaagttcgcgcgcg 1619 | ||||| || |||||||| ||||||||||| || ||||| Sbjct: 4655 tagaaaagcttaaatccaatattgaagaagtgcgtgcgcg 4694 Query: 889 cagatcctcgcctgtggtacttcttataactccggtatggtttcccgctactggtttgaa 948 |||||| ||||||| |||||||||||||| | || ||| | || |||||||||||| Sbjct: 3961 cagatcgtcgcctgcggtacttcttataatgcagggatgacggcacgttactggtttgaa 4020 Query: 949 tcgctagcaggtattccgtgcgacgtcgaaatcgcctctgaattccgctatcgcaaat 1006 ||| |||| ||| | || || ||||||||||| |||||||||||||||||||||| Sbjct: 4021 tcgttagcgggtgtgagctgtgatgtcgaaatcgcgtctgaattccgctatcgcaaat 4078 Query: 1754 cttaccatgtcgcgctgatcaaaggcaccgacgttgaccagccgcgtaacctggcaaaat 1813 |||||||||| || | |||||||| ||||| ||||||||||| |||||||| || ||| Sbjct: 4829 cttaccatgtggctttaatcaaaggtaccgatgttgaccagcctcgtaaccttgctaaag 4888 Query: 1814 cggttacggttgagtaa 1830 |||| || || |||||| Sbjct: 4889 cggtaactgtcgagtaa 4905 Query: 1123 tgtaacgttccgggttcttctctggtgcgcgaatc 1157 ||||||||| ||||||||||||| ||||| ||||| Sbjct: 4195 tgtaacgttgcgggttcttctctcgtgcgtgaatc 4229 Query: 285 ggtggtgcataacggcatcatcgaaaaccatgaaccgctgcgt 327 |||||| || |||||||| ||||||||||||||| ||||||| Sbjct: 3357 ggtggtacacaacggcattatcgaaaaccatgaaatgctgcgt 3399 Query: 1 atgtgtggaattgttggcgcgatcgcgcaacgtgatgtagcagaaatccttcttgaaggt 60 ||||||||||||||||| ||| | || ||||| ||||| || ||||| | | |||| Sbjct: 3073 atgtgtggaattgttggtgcggttgcacaacgcgatgttgctgaaattttagtacaaggc 3132 Query: 61 ttacgtcgtctggaataccgcggatatgactctgc 95 |||| ||||| ||||||||||| ||||||||||| Sbjct: 3133 ctacgccgtcttgaataccgcggctatgactctgc 3167 BLASTN dasturining ixtisosligi E. coli glmS geniga etkazish xususiyatlarining natijalari Pseudomonas aeruginosa, Pasteurella multocida va Vibrio xolera genomlari bo'yicha. hakl 1. E. coli glmS genlar ketma-ketligi va E. coli GlmS ortologini kodlovchi V. vabera genlari ketma-ketligi bo'yicha mintaqalarni tekislash. Tizimlar BLASTN dasturi tomonidan qurilgan. Genlarning to'liq bo'linishini bir necha qismlarga bo'lishining sababi bu genetik kodning nasli. Ko'pgina aminokislotalar qoldiqlari uchun kodonning uchinchi pozitsiyasi ahamiyatga ega emas (ya'ni har xil uchinchi pozitsiyaga ega kodonlar odatda bir xil aminokislotani kodlaydi). Shunday qilib, genning deyarli har uchinchi nukleotidi selektsiya bosimi bilan topilmaydi. Bu, uchinchi bir-biriga yaqin bo'lgan organizmlar (E. coli va V. chorarae) genlarining ayrim qismlarining har uchinchi qoldiq uchun farq qilishi mumkinligiga olib keladi, bu ham rasmda ko'rsatilgan izalanishlar bilan tasdiqlanadi. Nazorat savollari: 1. BLAST nima? 2. Biologik ketma-ketliklarni tenglashtirishdan maqsad nima? 3. BLAST qanday dastur? Download 196.54 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling