Mundrij a kirish I. Bob. “Bioinformatika” faniga kirish

I.2 Bioinformatika ma'lumotlarining xususiyati

bet	3/12
Sana	23.09.2023
Hajmi	0.56 Mb.
	#1685202

1 2 3 4 5 6 7 8 9 ... 12

Bog'liq
“BIOINFORMATIKA” faniga kirish

I.2 Bioinformatika ma'lumotlarining xususiyati
Biologiya an'anaviy ravishda tahliliy fan emas, balki tavsiflovchi fan sifatida qaraladi. Ilm-fandagi so'nggi yutuqlar ushbu asosiy yo'nalishni o'zgartirmagan bo'lsa-da , biologik ma'lumotlarning tabiati tubdan o'zgardi .
Yaqin vaqtgacha barcha biologik kuzatuvlar asosan tasodifiy bo'lib kelgan , garchi turli darajadagi aniqliklarga ega bo'lsa ham, ba'zilari esa haqiqatan ham juda yaxshi sifatda olib borilgan.
Tadqiqotning oxirgi avlodi biologik ma'lumotlarining birinchi xususiyati shundaki, ma'lumotlar nafaqat miqdoriy va aniqroq, balki nukleotidlar va aminokislotalar ketma-ketligida bo'lgani kabi, ular diskretga aylandi.
Alohida organizmning genomik ketma-ketligini ochish yoki klonlash nafaqat to'liq, balki eng muhimi, aniq bo'lishi mumkin bo'ldi. Eksperimental xatolarni hech qachon butunlay inkor etib bo'lmaydi, ammo zamonaviy genom ketma-ketligi uchun ular juda past.
Bu biologiya analitik fanga aylandi, degani emas. Hayot haqiqatan ham fizika va kimyo qonunlariga bo'ysunadi, lekin u juda murakkab va tarixiy baxtsiz hodisalar zanjiriga bog'liq bo'lib, uning xususiyatlarini fundamental printsiplarga asoslanib batafsil tushuntira olmaydi. Va genomni aniqlashning erishilgan aniqligi hayot hodisasini tushuntirish uchun etarli shart emas.
Ikkinchi aniq xususiyati ularning katta miqdoridir. Hozirgi vaqtda nukleotidlar ketma-ketligining ma'lumotlar bazalarida 100 milliardga yaqin nuklein tayanch juftlari mavjud. Agar o'lchov birligi sifatida inson genomining o'lchamini (HUman Genome Equivalent, HUGE) oladigan bo'lsak, unda bu ma'lumot miqdori 35 HUGE ga teng. Faqat oqsil tuzilmalari ma'lumotlar bazasida 86 000 dan ortiq yozuvlar mavjud bo'lib, ularning har biri uch o'lchovli fazoda berilgan oqsilning ~ 400 aminokislota qoldiqlari koordinatalarining to'liq tavsifi (1.1-rasm)

2.1-rasm. PDB Protein ma'lumotlar banki veb-sahifasi
Nafaqat alohida ma'lumotlar banklari juda katta, balki o'sishning eksponent sur'ati ham juda katta . Shunday qilib, masalan, 1-jadvalda genetik ketma-ketliklar ma'lumotlar bazasini to'ldirish dinamikasi ko'rsatilgan GenBank, Biologik ma'lumotlarning bunday miqdori va sifati tadqiqotchilarni quyidagi maqsadlarga erishishga undaydi:

Tirik mavjudotlar olamining rasmini aniq va to'liq ko'rish, ya'ni muvofiqlashtirilgan murakkab tizimlar sifatida qaraladigan organizmlar biologiyasining integral tomonlarini tushunish .
ketligi , uch o'lchovli tuzilishi, o'zaro ta'siri va funktsiyalarini bog'lang.
Vaqt o'tishi bilan organizmlarni o'rganish uchun asos sifatida zamonaviy organizmlar haqidagi ma'lumotlardan foydalaning : evolyutsiya tarixidagi voqealar ketma-ketligini hisoblash uchun vaqtni orqaga qaytarish (filogenetik tahlil), biologik tizimlarning ilmiy asoslangan modifikatsiyasiga (biotexnologiya) oldinga
Ushbu bilimlarni tibbiyot, qishloq xo'jaligi va boshqa sohalarda qo'llashni targ'ib qilish

GenBank ma'lumotlar bazasining o'sish dinamikasi
DNK molekulasi minglab nukleotidlardan iborat va shuning uchun butun xromosoma DNK molekulasining to'liq nukleotidlar ketma-ketligini aniqlash juda qiyin ishdir. Genlarni klonlash texnologiyasi va polimeraza zanjiri reaktsiyasi (PCR) paydo bo'lishi bilan olimlar xromosoma DNKsining alohida qismlarini ajratib olishga muvaffaq bo'lishdi. Bu yutuqlar, o‘z navbatida, tez va samarali DNK sekvensiyasi texnikasini ishlab chiqishga zamin yaratdi . 1970-yillarning oxirida ikkita ketma-ketlik usuli paydo bo'ldi, ular mos ravishda zanjirni tugatish va kimyoviy parchalanish reaktsiyalariga asoslangan. Ushbu usullar, ba'zi bir kichik o'zgartirishlar bilan, 80-90-yillardagi ketma-ketlik inqilobi va keyinchalik bioinformatikaning tug'ilishi uchun asos yaratdi. O'zining sezgirligi, o'ziga xosligi va avtomatlashtirish imkoniyatlari tufayli PCR genomik DNK namunalarini tahlil qilish va genetik xaritalarni yaratish uchun etakchi usul hisoblanadi. Asosiy PCR texnologiyasini keyingi takomillashtirish ushbu texnikaning quvvati va foydaliligini yanada oshirdi.
1980-yillarning boshlarida tadqiqotchilar qo'lda (elektron yozuvchilar yordamida) jel plyonkasidagi bantlar naqshidan DNK ketma-ketligini o'qiydilar. 1987 yilda Stiven A. Krawetz geliy plyonkalarini avtomatik o'qiydiganlar uchun birinchi dasturiy ta'minotni ishlab chiqdi.
1987 yilda yarim avtomatlashtirilgan usulda sekvensiyalangan birinchi ketma-ketlik ishlab chiqarilgandan, 1990 yilda PCR amaliy amalga oshirilgandan va Sanger polimerini nusxalash usuli bilan ishlab chiqarilgan DNK fragmentlarini lyuminestsent yorliqlash usuli joriy etilgandan beri keng ko'lamli ketma-ketlik mavjud. amalga oshirildi, bu esa bioinformatika rivojiga beqiyos hissa qo‘shdi. Shu bilan birga, ketma-ketlik ketma-ketligi natijalarini avtomatlashtirilgan tarzda ro'yxatga olish texnologiyalari sezilarli darajada rivojlandi.
1990-yillar boshida Jon Kreyg Venter va uning hamkasblari genlarni aniqlashning yangi usulini ixtiro qildilar. Venter guruhi bitta nukleotidning yakuniy rezolyutsiyasida xromosomali DNKni ketma-ketlashtirish o'rniga, mRNK molekulalarini ajratib oldi, ularni cDNK molekulalariga ko'chirdi va keyin cDNK molekulasining bir qismini ketma-ketlashtirdi, natijada EST uchun ifodalangan ketma-ketlik teglari yaratildi. Birinchi marta). Entoni Kerlavaj tomonidan taklif qilingan. Ushbu EST ketma-ketliklari butun genni ajratish uchun ko'rsatkichlar (identifikatorlar, "barmoq izlari") sifatida ishlatilishi mumkin edi. Bundan tashqari, EST yorliqlash yondashuvi nukleotidlar ketma-ketligining ulkan ma'lumotlar bazalarini tashkil qilishni talab qildi va, EST usulini ishlab chiqish yangi genlarni yuqori mahsuldorlik bilan kashf qilish loyihalarini amalga oshirishning maqsadga muvofiqligini ko'rsatdi va amaliy genomikani rivojlantirish uchun asosiy turtki bo'ldi.
1980-yillarda bir qator loyihalar inson genomining batafsil genetik va fizik xaritalarini yaratishga kirishdi (3-rasm). Ushbu loyihalarning maqsadi inson genomining to'liq nukleotidlar ketma-ketligini ochish va taxminiy 30 000 genning lokuslarini (sobit pozitsiyalar, xromosomada lokalizatsiya) aniqlash edi . Bunday keng miqyosdagi ishlar genetik xaritalar va DNK ketma-ketligi ma'lumotlarini tahlil qilish uchun yangi hisoblash usullarini ishlab chiqishni rag'batlantirdi, shuningdek, DNKni dekodlash va tahlil qilish uchun yangi usullar va laboratoriya uskunalarini ishlab chiqishni talab qildi. Tadqiqotchilarning keng doirasini dekodlash natijalari bilan tezroq tanishtirish uchun olingan ma'lumotlarni tarqatishning takomillashtirilgan vositalarini ishlab chiqish kerak edi.
Ushbu global tashabbus natijasida yaratilgan xalqaro tadqiqot dasturi Inson genomi loyihasi ( HGP) deb nomlandi. Bu va boshqa genom ketma-ketligi loyihalari haqida ko'proq ma'lumotni quyidagi manzilda topishingiz mumkin:

http://genomics.energy.gov/;
http://ornl.gov/sci/techresources/Human_Genome/publicat/ tko/index.html;
http://www.geneontology.org/GO.refgenome.shtml;
http://www.genome.gov/.

2007 yilda http://www.1000genomes.org 1000 genom loyihasi ishga tushirildi - har birida 6 Giga-baza juftligi (6 Gbp) va jami 6 Terapar asoslari (6 Tbp) bo'lgan 1000 kishining to'liq genomlarini dekodlash. [56]. 2012 yil mart oyiga kelib, dekodlangan genlarning to'liq tavsifi hajmi 260 terabaytdan ortiq bo'lgan 250 000 dan ortiq faylni tashkil etdi. Ushbu loyiha uchun Ma'lumotlarni muvofiqlashtirish markazi (DCC ) tashkil etildi va yangi avlod sekvensiyasi (NGS) texnologiyalari ishlab chiqildi , bu bitta genomni sekvensiyalash narxini 5000 AQSh dollarigacha
pasaytirdi.

Download 0.56 Mb.

Do'stlaringiz bilan baham:

1 2 3 4 5 6 7 8 9 ... 12