6- amaliy mashg‘ulot mavzu: blast dasturi yordamida nukleotid ketma-ketliklarini solishtirish Dars maqsadi


Download 196.54 Kb.
Pdf ko'rish
Sana24.04.2023
Hajmi196.54 Kb.
#1394847
Bog'liq
6- AMALIY MASHG‘ULOT



6- AMALIY MASHG‘ULOT 
Mavzu: BLAST dasturi yordamida nukleotid ketma-ketliklarini solishtirish 
Dars maqsadi: Talabalarga BLAST dasturi yordamida nukleotid ketma-
ketliklarini solishtirish bo’yicha amaliy ko’rsatmalar va tushunchalar berish. 
Kerakli jihozlar: Kompyuter va uning dasturlari, internet tarmog’i, 
videoproyektor.
Ishning mazmuni: BLAST (Berkeley Lazy Abstraction Software 
Verification Tool) - bu C tilini namunaviy tekshirish dasturi. BLAST (Basic Basic 
Alignment Search Tool) - asosiy tuzilish (ketma-ketlik) yoki uning bo'lagi ma'lum 
bo'lgan 
oqsillar 
yoki 
nuklein 
kislotalarning 
homologlarini 
qidirishda 
foydalaniladigan kompyuter dasturlari oilasi. BLAST-dan foydalanib, tadqiqotchi 
o'z ketma-ketligini ma'lumotlar bazasidagi ketma-ketliklar bilan taqqoslashi va 
taxmin qilinayotgan homologlarning ketma-ketligini topishi mumkin. Bu 
molekulyar biologlar, bioinformatika, sistematikalar uchun eng muhim vositadir. 
Blast oynasi 
BLAST 
nukleotidlarining 
ketma-ketligi 
dasturi. Belgilanmaganga 
o'xshash oqsillarni kodlovchi genlarning aniqlanmagan genomlarini qidiringE. coli 
GlmS ga o'xshash oqsillarni kodlovchi genlarni qidirish amalga oshirildi. Qidiruv 
quyidagi organizmlarning aniqlanmagan genomlari bo'yicha olib borildi: 
Pseudomonas aeruginosa, Pasteurella multocida va Vibrio vabo. NCBI Entrez 
taksonomiyasining ma'lumotlariga ko'ra, bu organizmlarning barchasi E. colining 


juda yaqin qarindoshlari bo'lib, ular bir xil Gammaproteobakteriyalar sinfiga 
kiradi. 
Format dasturi yordamida qidiruvni amalga oshirishdan oldin har bir genom 
uchun indeksli fayllar, shuningdek uchta genom uchun indeksli fayllar alohida 
yaratildi. Ikkala holatda ham dastur nhr, nin va nsq kengaytmali uchta faylni 
yaratdi. Nsq kengaytmali fayl (nukleotidlar ketma-ketligi) 4 marta siqilgan 
nukleotidlar ketma-ketligi to'g'risidagi ma'lumotlarni o'z ichiga oladi. Ushbu fayl 
boshqa ikkalasiga qaraganda ancha katta. Nhr va ninali fayllar (nukleotid 
indekslari) yordamchi bo'lib, mos ravishda to'liq genomni tashkil etuvchi yozuvlar 
sarlavhalarini va indekslarning ro'yxatini o'z ichiga oladi (formatdb dasturi uchun 
hujjatlarni ko'ring). Qidiruvni amalga oshirish uchun BLAST to'plamidagi 
TBLASTN dasturidan foydalanildi, u oltita freymdagi tarjima mahsuloti kirish 
oqsillari ketma-ketligiga o'xshash nukleotidlar ketma-ketliklarini aniqlash uchun 
ishlab chiqilgan.
 
Nukleotid Blast oynasi 
Elektron qiymatning chegaraviy qiymati 0,01 ga teng tanlangan. Qidiruv 
natijalari jadvalda keltirilgan.
Nukleotidning ketma-ketligini taqqoslaganda (2) formula bilan aniqlanadi. 
Uzunligi m o'rganilgan ketma-ketlikni ko'plab ma'lumotlar bazalari ketma-ketligi 
bilan taqqoslash ikki nuqtaga asoslanishi mumkin. Birinchi nuqta, ma'lumotlar 
bazasining barcha ketma-ketliklari o'rganilayotganga o'xshashdir. Bu ma'lumotlar 


bazasida mavjud bo'lgan qisqa ketma-ketlik bilan hizalanish uchun E qiymatini 
uzun ketma-ketlik bilan tekislash uchun E qiymatiga tenglashtirish kerakligini 
anglatadi. Ma'lumotlar bazasidan E qiymatini hisoblash uchun olingan E qiymatini 
undagi ketma-ketliklar soniga juft-juft taqqoslash orqali ko'paytirish kerak. 
Ikkinchi nuqta, o'rganilgan ketma-ketlik uzoq ketma-ketliklarga qaraganda 
qisqaroqroqqa o'xshaydi, chunki ikkinchisi ko'pincha turli qismlardan iborat (ko'p 
oqsillar domenlardan iborat). Agar o'xshashlik ehtimolligi ketma-ketlik uzunligiga 
mutanosib deb hisoblasak, n uzunlikdagi ma'lumotlar bazasi uchun E ning juft 
qiymatini N / n ga ko'paytirish kerak, bu erda N - bazadagi aminokislotalar yoki 
nukleotidlarning umumiy uzunligi. BLAST dasturlari asosan ushbu yondashuvdan 
ma'lumotlar bazasidan E qiymatlarini hisoblashda foydalanadilar. 
Nazariy jihatdan, mahalliy moslashtirish har qanday nukleotid yoki 
aminokislotalarning hizalanadigan ketma-ketligidan boshlanishi mumkin. Biroq, 
GES, qoida tariqasida, ketma-ketlikning chetiga (boshiga yoki oxiriga) yaqin 
boshlamaydi. Bunday chekka effektni tuzatish uchun ketma-ketlikning samarali 
uzunligini hisoblash kerak. 200 dan ortiq qoldiq bo'lsa, chekka effekti 
neytrallanadi. 
BLASTN AC-ni chiqarishda bu yozuv AE004967. AE004967 yozuvi 2006 yil 12 
iyulda AE004091 bilan almashtirildi. Shubhasiz, P. aeruginosa genom yozuvlari 
EMBL-ning oldingi versiyalaridan olingan. EMBL-ning SRS-qidiruvi EMBL-ning 
87-versiyasida AE004967-ni topdi. CDS koordinata qiymatlari topilgan yozuvdan 
olinadi. 
Query: 1460 tgaaagagatctcttacattcacgctgaagcctacgctgctggcgaactgaaacacggtc 1519
||||||||||||||||||| ||||| |||||||| || || ||||| || || || || | 
Sbjct: 4535 tgaaagagatctcttacatccacgcagaagcctatgcagcgggcgagctaaagcatggcc 4594 
Query: 1520 cgctggcgctaattgatgccgatatgccggttattgttgttgcaccgaacaacgaattgc 1579 
| ||||| |||||||||| |||||||| || |||| |||||||| | ||| ||| ||
Sbjct: 4595 cattggcgttaattgatgcggatatgccagtggttgtggttgcaccaagcaatgaactgt 4654 
Query: 1580 tggaaaaactgaaatccaacattgaagaagttcgcgcgcg 1619 
| ||||| || |||||||| ||||||||||| || ||||| 
Sbjct: 4655 tagaaaagcttaaatccaatattgaagaagtgcgtgcgcg 4694 
Query: 889 cagatcctcgcctgtggtacttcttataactccggtatggtttcccgctactggtttgaa 948 
|||||| ||||||| |||||||||||||| | || ||| | || |||||||||||| 
Sbjct: 3961 cagatcgtcgcctgcggtacttcttataatgcagggatgacggcacgttactggtttgaa 4020 
Query: 949 tcgctagcaggtattccgtgcgacgtcgaaatcgcctctgaattccgctatcgcaaat 1006 
||| |||| ||| | || || ||||||||||| |||||||||||||||||||||| 
Sbjct: 4021 tcgttagcgggtgtgagctgtgatgtcgaaatcgcgtctgaattccgctatcgcaaat 4078 


Query: 1754 cttaccatgtcgcgctgatcaaaggcaccgacgttgaccagccgcgtaacctggcaaaat 1813 
|||||||||| || | |||||||| ||||| ||||||||||| |||||||| || |||
Sbjct: 4829 cttaccatgtggctttaatcaaaggtaccgatgttgaccagcctcgtaaccttgctaaag 4888 
Query: 1814 cggttacggttgagtaa 1830 
|||| || || |||||| 
Sbjct: 4889 cggtaactgtcgagtaa 4905 
Query: 1123 tgtaacgttccgggttcttctctggtgcgcgaatc 1157 
||||||||| ||||||||||||| ||||| ||||| 
Sbjct: 4195 tgtaacgttgcgggttcttctctcgtgcgtgaatc 4229 
Query: 285 ggtggtgcataacggcatcatcgaaaaccatgaaccgctgcgt 327 
|||||| || |||||||| ||||||||||||||| ||||||| 
Sbjct: 3357 ggtggtacacaacggcattatcgaaaaccatgaaatgctgcgt 3399 
Query: 1 atgtgtggaattgttggcgcgatcgcgcaacgtgatgtagcagaaatccttcttgaaggt 60 
||||||||||||||||| ||| | || ||||| ||||| || ||||| | | ||||
Sbjct: 3073 atgtgtggaattgttggtgcggttgcacaacgcgatgttgctgaaattttagtacaaggc 3132 
Query: 61 ttacgtcgtctggaataccgcggatatgactctgc 95 
|||| ||||| ||||||||||| ||||||||||| 
Sbjct: 3133 ctacgccgtcttgaataccgcggctatgactctgc 3167
BLASTN dasturining ixtisosligi E. coli glmS geniga etkazish xususiyatlarining natijalari 
Pseudomonas aeruginosa, Pasteurella multocida va Vibrio xolera genomlari bo'yicha. hakl 1. E. 
coli glmS genlar ketma-ketligi va E. coli GlmS ortologini kodlovchi V. vabera genlari ketma-ketligi 
bo'yicha mintaqalarni tekislash. Tizimlar BLASTN dasturi tomonidan qurilgan. 
Genlarning to'liq bo'linishini bir necha qismlarga bo'lishining sababi bu genetik 
kodning nasli. Ko'pgina aminokislotalar qoldiqlari uchun kodonning uchinchi 
pozitsiyasi ahamiyatga ega emas (ya'ni har xil uchinchi pozitsiyaga ega kodonlar 
odatda bir xil aminokislotani kodlaydi). Shunday qilib, genning deyarli har 
uchinchi nukleotidi selektsiya bosimi bilan topilmaydi. Bu, uchinchi bir-biriga 
yaqin bo'lgan organizmlar (E. coli va V. chorarae) genlarining ayrim qismlarining 
har uchinchi qoldiq uchun farq qilishi mumkinligiga olib keladi, bu ham rasmda 
ko'rsatilgan izalanishlar bilan tasdiqlanadi.
Nazorat savollari: 
1. BLAST nima? 
2. Biologik ketma-ketliklarni tenglashtirishdan maqsad nima? 
3. BLAST qanday dastur? 


 

Download 196.54 Kb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling