Bioinformatikaning kompyuter komponentlari


Download 1.59 Mb.
bet1/2
Sana25.09.2023
Hajmi1.59 Mb.
#1687638
  1   2
Bog'liq
Bioinformatika


BIOINFORMATIKANING KOMPYUTER KOMPONENTLARI
REJA:


  1. Bioinformatika haqida ma’lumotlar

  2. Bioinformatika tarixi

  3. Bioinformatikaning hozirgi kundagi o‘rni


Bioinformatika — umumiy biologiyamolekulyar biologiya , kibernetikagenetika , kimyoinformatika , matematika va statistikani birlashtirgan fanlararo sohadir. Katta hajmdagi maʼlumotlarni tahlil qilishni talab qiladigan keng koʻlamli biologik muammolar bioinformatika dasturlari yordamida hal qilinadi..
Bioinformatika asosan kompyuter usullarini oʻrganish va ishlab chiqishni oʻz ichiga oladi va biologik maʼlumotlarni olish, tahlil qilish, saqlash, tartibga solish va vizualizatsiya qilishga qaratilgan.
Bioinformatika amaliy matematika , statistika va informatika usullardan foydalanadi. Bioinformatika biokimyo , biofizika , ekologiya va boshqa sohalarda qoʻllaniladi.
Bu sohada eng koʻp qoʻllaniladigan dasturlar va texnologiyalar PythonRJavaC#C++ dasturlash tillari hisoblanadi.
Belgilash tili — XML ​​;
Maʼlumotlar bazalari uchun dasturlash tili — SQL;
Parallel hisoblashning dasturiy va apparat arxitekturasi — CUDA;
Texnik hisob-kitoblarga oid masalalarni yechish uchun amaliy dasturlar toʻplami va ushbu paketda qoʻllaniladigan dasturlash tili — MATLAB va elektron jadvallar hisoblanadi.
Bioinformatika biologiyaning koʻplab sohalarining muhim qismiga aylandi. Bioinformatikaning tahlil usullari ushbu soha rivojlanishidan oldin deyarli imkonsiz boʻlgan katta hajmdagi eksperimental maʼlumotlarni sharhlash imkonini beradi. Genetika va genomika sohasida bioinformatika genomlarning funksional annotatsiyasi, mutatsiyalarni aniqlash va tahlil qilishda yordam beradi. Bularning ichida muhim vazifalarnig biri gen ekspressiyasi va uni tartibga solish usullarini oʻrganishdir. Bundan tashqari, bioinformatika dasturlari genomik maʼlumotlarni solishtirish imkonini beradi, bu molekulyar evolyutsiya qonuniyatlarini oʻrganishga imkon tugʻdiradi. Umuman olganda, bioinformatika tizim biologiyasining muhim qismi boʻlgan biokimyoviy yoʻllar va tarmoqlarni tahlil qilish va kataloglashda yordam beradi. Strukturaviy biologiyada u DNK, RNK va oqsil tuzilmalarini, shuningdek molekulyar oʻzaro taʼsirlarni modellashtirishda yordam beradi. Biologik maʼlumotlarni qayta ishlash sohasidagi soʻnggi yutuqlar biomeditsina sohasida sezilarli oʻzgarishlarga olib keldi. Bioinformatikaning rivojlanishi tufayli olimlar irsiy va orttirilgan kasalliklarning asosiy molekulyar mexanizmlarini aniqlashga muvaffaq boʻlishdi, bu esa samarali davolash usullarini ishlab chiqishga va kasalliklarni tashxislash uchun aniqroq testlarni ishlab chiqishga yordam beradi. Bemorlarga dori vositalarining samaradorligi va salbiy taʼsirini bashorat qilishga imkon beruvchi tadqiqot yoʻnalishi farmakogenetika deyiladi. Farmakogenetikaning asosi bioinformatika usullariga tayangan.

DNK va oqsil ketma — ketliklari aniqlanishining bioinformatika fani tarixida 1950-yillardagi yutuqlardan kuzatish mumkin. 1953 — yil fevral oyida Watson va Crick DNK molekulasining modelini taklif qilishdi va 1953 — yil may oyida ular Nature jurnalida genetik maʼlumot kodining tashuvchisi sifatida DNK molekulyasiga oid maqola chop etishdi. Shuningdek, 1950-yillarning oxirida Sanger birinchi oqsil ketma-ketligini, insulinni nashr etdi. Aminokislotalar ketma-ketligini aniqlashning eng koʻp qoʻllaniladigan usuli — Edman degradatsiya usuli, uning asosiy kamchiligi uzun oqsil ketma-ketligini olishda qiyinchilik tugʻdiradi. Nazariy tarafdan har bir reaktsiya uchun maksimal 50-60 aminokislota toʻgʻri keladi. Bu muammoning yechimini amerikalik olim va fizik kimyogar Margaret Dejhoff (1925-1983) kompyuter dasturlaridan faol foydalangan holda va ularni biologiya va tibbiyot sohalarida qoʻllash imkoniyatlarini ishlab chiqqan. U 1962-yilda Edman peptid sekvensiyasi maʼlumotlaridan foydalangan holda oqsilning birlamchi tuzilishini aniqlash dasturi boʻlgan COMPROTEINni ishlab chiqdi.


COMPROTEIN-da aminokislotalar ketma-ketligini kiritish va chiqarish uch harfli qisqartmalarda taqdim etilgan. Oqsil ketma-ketligi maʼlumotlarini qayta ishlashni soddalashtirish uchun Dayhoff keyinchalik bugungi kunda ham qoʻllaniladigan bir harfli aminokislota kodini ishlab chiqdi. Dayhoffning ushbu sohaga qoʻshgan hissasi shunchalik kattaki, Milliy Biotexnologiya Axborot Markazining (NCBI) sobiq direktori Devid J. Lipman uni „bioinformatikaning onasi va otasi“ deb atagan.
Yangi oqsil ketma-ketliklarining toʻplanishi bilan ularda baʼzi nuqsonlar kuzatila boshlandi. Masalan, Tsukerkandl va Pauling umurtqali hayvonlarning ortologik oqsillari (masalan, gemoglobin) konvergent evolyutsiya natijasi boʻlishi uchun juda koʻp ketma-ketlik oʻxshashligini koʻrsatishini aniqladilar. Yangi evolyutsion farazlarni tasdiqlash uchun yangi matematik va kompyuter usullari kerak edi. Oqsil ketma-ketliklarini juftlik bilan aniqlash uchun birinchi dinamik dasturlash algoritmi 1970 — yilda Needleman va Wunsch tomonidan ishlab chiqilgan.
Bir nechta ketma-ketlikni aniqlash algoritmlari ancha keyin paydo boʻldi: birinchi amaliy algoritm 1987 — yilda Da-Fei Feng va Russell F. Duolittle tomonidan ishlab chiqilgan. Uning soddalashtirilgani CLUSTAL algoritmi bugungi kunda ham qoʻllanilmoqda. Bundan tashqari, 1978 — yilda Dayhoffni oʻz ichiga olgan bir guruh olimlar 85 % dan ortiq oʻziga xoslikka ega boʻlgan 71oqsil oilasining filogenetik daraxtlarini tuzishdi va unda nuqtali mutatsiyalarni (PAMs) kuzatish asosida birinchi almashtirish modelini yaratdilar. Natijada, aminokislotalarni almashtirish ehtimoli qiymatlarini oʻz ichiga olgan matritsa olindi.
1970-yilda Frensis Krik tomonidan nashr etilgan „Molekulyar biologiyaning markaziy dogmasi“ va 68 kodon bilan kodlangan barcha aminokislotalarning progressiv identifikatsiyasi, 1970-1980-yillarda oqsil evolyutsiyasidan DNK evolyutsiyasiga bosqichma-bosqich oʻzgarishiga olib keldi. DNK ketma-ketligini aniqlashni oʻrganish kerak edi. Birinchi keng tarqalgan DNK sekvensiyasi usuli 1976-yilda Maxam-Gilbert sekvensiyasi usuli edi. Biroq, eng koʻp qoʻllaniladigan usul 1977 — yilda Frederik Sanger laboratoriyasida ishlab chiqilgan boʻlib, u bugungi kunda ham qoʻllaniladi. Sanger sekvensiyasi oʻsha vaqt uchun juda katta hajmdagi maʼlumotni olish imkonini berdi, ammo ketma-ket boʻlishi mumkin boʻlgan fragmentlarning hajmi yuzlab nukleotidlar bilan cheklangan edi, bu faqat bakteriofag genomlari kabi kichik genomlarni oʻrganish uchun etarli edi. Birinchi Sanger sekvensiyasi dasturi 1979-yilda Rojer Staden tomonidan nashr etilgan.
21-asr boshlarida inson genomining nashr etilishi bilan bioinformatikaning genomik davri boshlandi. Loyiha 1991 — yilda Qoʻshma Shtatlarda boshlangan va 13 yil davomida 2,7 milliard dollarga tushgan. 1998 — yilda Celera Genomics inson genomini ketma-ketliklarni aniqlash va yigʻish boʻyicha raqobatbardosh xususiy tadqiqotni ishlab chiqdi. Tadqiqot 10 barobar kamroq pul talab qildi va 454 va Illumina kabi yangi eksperimental ketma-ketlik strategiyalarini ishlab chiqildi. DNK ketma-ketligining aniqlashga ketkan xarajat ancha kamaydi, bu esa ommaviy maʼlumotlar bazalarida ketma-ketliklar sonining katta oʻsishiga olib keldi. Biologik maʼlumotlarni saqlash va tezkor qayta ishlash usullarini ishlab chiqish zarurati tugʻildi. 2005-yilda Genomik Standartlar Konsortsiumi tashkil etildi va genomik ketma-ketlikni nashr qilish uchun zarur boʻlgan minimal maʼlumotlarni belgilab berdi.

Bioinformatikaning asosiy maqsadi biologik jarayonlarni tushunishga hissa qoʻshishdir. Bioinformatikani boshqa biologiya yoʻnalishlaridan ajratib turadigan jihati shundaki, u ushbu maqsadga erishish uchun intensiv hisoblash usullarini yaratish va qoʻllashga qaratilgan. Shunga oʻxshash usullarga misollar namunani aniqlash, maʼlumotlarni olish, mashinani oʻrganish algoritmlari va biologik maʼlumotlarni vizualizatsiya qilishdir.
Tadqiqotchilarning asosiy saʼy-harakatlari ketma-ketlikni moslashtirish, genlarni topish (genlarni kodlovchi DNK mintaqasini qidirish), genomni dekodlash, dori-darmonlarni loyihalash, dori-darmonlarni ishlab chiqish, oqsil tuzilishini moslashtirish, oqsil tuzilishini bashorat qilish, genlar ifodasini bashorat qilish muammolarini hal qilishga qaratilgan.va oqsil-oqsil oʻzaro taʼsiri, genom boʻylab assotsiatsiyalarni izlash va evolyutsiyani modellashtirish.
Bioinformatika bugungi kunda biologik maʼlumotlarni boshqarish va tahlil qilishda yuzaga keladigan amaliy va nazariy muammolarni hal qilish uchun maʼlumotlar bazalari, algoritmlar, hisoblash va statistik usullar va nazariyani yaratish va takomillashtirishni nazarda tutadi.
1977-yilda Phi -X174 fagi ketma-ketligi aniqlangandan beri koʻpayib borayotgan organizmlarning DNK ketma-ketligi dekodlanadi va maʼlumotlar bazalarida saqlanadi. Ushbu maʼlumotlar oqsil ketma-ketligini va tartibga soluvchi hududlarni aniqlash uchun ishlatiladi.
Bir xil yoki turli turlardagi genlarni taqqoslash oqsil funktsiyalarida yoki turlar oʻrtasidagi munosabatlarda oʻxshashlikni koʻrsatishi mumkin (shunday qilib Filogenetik daraxtlarni tuzish mumkin). Maʼlumotlar miqdori ortishi bilan ketma-ketlikni qoʻlda tahlil qilish uzoq vaqtdan beri imkonsiz boʻlib qoldi. Hozirgi kunda milliardlab juftliklardan iborat minglab organizmlarning genom nukleotidlarini qidirish kompyuter dasturlaridan foydalaniladi.
Dasturlar turli turlarning genomlaridagi oʻxshash DNK ketma-ketliklarini noyob tarzda aniqlashi mumkin; koʻpincha bunday ketma-ketliklar oʻxshash funktsiyalarga ega va farqlar kichik mutatsiyalar natijasida yuzaga keladi, masalan, alohida nukleotidlarni almashtirish, nukleotidlarni kiritish va ularning „yoʻqolishi“ (deletsiya) larni keltirsak boʻladi.
Evolyutsion biologiya turlarning kelib chiqishi va paydo boʻlishini, shuningdek ularning vaqt oʻtishi bilan rivojlanishini oʻrganadi. Bioinformatika fani evolyutsion biologlarga bir necha usulda yordam beradi:

  • koʻp sonli organizmlarning evolyutsiyasini nafaqat tuzilishi yoki fiziologiyasi boʻyicha emas, balki ularning DNKsidagi oʻzgarishlarni oʻrganishda ;

  • butun genomlarni solishtirganda (BLAST), murakkab evolyutsion hodisalarni oʻrganish, masalan: genlarning koʻpayishi, gorizontal gen oʻtkazilishi va bakterial ixtisoslashgan omillarni bashorat qilish;

  • vaqt oʻtishi bilan tizimning harakatini bashorat qilish uchun populyatsiyalarning kompyuter modellarini yaratish;

  • koʻp sonli turlar toʻgʻrisidagi maʼlumotlarni oʻz ichiga olgan nashrlarni kuzatish.

Genetik algoritmlardan foydalanadigan boinformatika sohasi koʻpincha hisoblash evolyutsion biologiyasi bilan chalkashib ketadi, ammo bu ikki soha bir-biriga bogʻliq boʻlishi shart emas. Ushbu sohadagi ishlar algoritmlar va hisob-kitoblarni yaxshilash uchun maxsus dasturlardan foydalanadi va replikatsiya, rekombinatsiya yoki mutatsiya orqali diversifikatsiya va tabiiy tanlanish orqali omon qolish kabi evolyutsion tamoyillarga asoslanadi.
Strukturaviy bioinformatika oqsillarning fazoviy tuzilishini bashorat qilish uchun algoritmlar va dasturlarni ishlab chiqishni oʻz ichiga oladi. Strukturaviy bioinformatikada tadqiqot mavzulari:

  • Makromolekulyarlarning rentgen difraksion tahlili (XRD).

  • XRD maʼlumotlaridan tuzilgan makromolekulyar modelning sifat koʻrsatkichlari

  • Makromolekulaning sirtini hisoblash algoritmlari

  • Oqsil molekulasining gidrofobik yadrosini topish algoritmlari

  • Oqsillarning strukturaviy domenlarini topish algoritmlari

  • Oqsil tuzilmalarining fazoviy moslashuvi

  • SCOP va CATH domenlarining strukturaviy tasniflari

  • Molekulyar dinamika

Ma'lumotlar bazasining yaratilishi va ularning intensiv ravishda to‘ldirilishi XX asrning 80-yillaridan boshlangan va juda tez sur'atlarda o‘smoqda. Ma'lumotlar bazasining hajmi uch yilda mobaynida ikki marotaba ortadi. Birgina ma'lumotlar bazasini yaratuvchilar tomonidan kiritilayotgan axborotlarning tuzilmasiga va sifatiga yetarli darajada e'tibor qaratishmayapti. Genetik matnlar ma'lumotlar bazasining tuzilish prinsiplari turli bahslarga olib kelmoqda. DNK ning birlamchi strukturasi va aminokislotalarning ketma – ketligi haqidagi axborotlarni saqlovchi EMBL, GenBank, DDBJ, SWISS-PROT singari yirik ma'lumotlar bazalari yangi olingan axborotlarni internet tizimida avtomatlashtirilgan to‘ldiruvchi sistemalar yordamida doimo to‘ldirib boriladi. Bir turdagi axborotlarni to‘plovchi ko‘plab ma'lumotlar bazalari xalqaro mehnat taqsimoti tizimida ishlashadi. Masalan, nukleotid ketma- ketliklari bo‘yicha axborotlarni to‘plovchi EMBL (Evropa), GenBank (AQSh), DDBJ (Yaponiya) kabi ma'lumotlar bazalarining faoliyatini shunga misol qilib keltirish mumkin.
Biologik ma'lumotlar bazalari –ilmiy tajribalar, nashr etilgan adabiyotlar, tadqiqot texnologiyasi va hisoblash ishlari natijasida to‘plangan bilimlardan saralangan hayot haqidagi fanga tegishli bo‘lgan ma'lumotlar kutubxonasidir. Bu yerda genomika, proteomika, metabolomika, genlar ekspresiyasi va filogenetika kabi tadqiqot yo‘nalishlariga tegishli bo‘lgan axborotlar saqlanadi. Ushbu axborotlar genlarning vazifasi, strukturasi, joylashishi (hujayra va xromasoma darajalarida), biologik ketma–ketlik va strukturalarning umumiy hususiyatlari bilan bir qatorda mutasiyalarning ham klinik effektlarini o‘z ichiga oladi.
Biologik ma'lumotlar bazasini tushunishda informatikaning relyasion (qo‘shnilar xaqida ma'lumot beruvchi) ma'lumot bazalari va raqamli kutubxonar qidiruviga doir axborot tushunchalari muxim sanaladi. Ma'lumotlar bazasining biologik loyixalashtirilishi, rivojlanishi va uzoq muddatli boshqaruvi bioinformatika fani soxasining asosiy y'nalishlaridan biri sanaladi.
Ma'lumotlar bazasining tarkibiga genlar ketma –ketligi, matnli tavsiflar, ontologiyalarning belgilari va klassifikasiyasi, sitatalar va jadvalli ma'lumotlar kiradi. Biologik ma'lumotlar bazasi olimlarga biomolekulalarning strukturasi va o‘zoro ta'siri, butun organizm darajasida ro‘y beruvchi metabolizmlar, turlarning rivojlanishini anglashga ko‘maklashuvchi vosita bo‘lib hisoblanadi. Bunday ma'lumotlarga ega bo‘lish kasalliklarga qarshi kurashishni osonlashtiradi, effektiv dori vositalarini ishlab chiqishga ko‘maklashadi hamda hayotning tarixiy taraqqiyotida organizmlar o‘rtasidagi o‘zoro munosabatlarni aniqlashga yordam beradi.
Biologik bilimlar turli –tuman, ixtisoslashgan ma'lumotlar bazalari orasida taqsimlangan bo‘ladi. Bu ba'zan ketma –ketlik to‘g‘risidagi axborotning ishonchliligiga xalaqit beradi.
Aminokislota va nukleotid ketma -ketligini solishtirish xozirgi kun molekulyar biologiyasining muxim soxalaridan biri xisoblanib, ular yordamida genlar oilasini aniqlash, ularga sekvenirlangan ketma -ketliklarni keltirish va strukturaviy xamda funksional munosabatlarini o‘rnatish mumkin. Ko‘plab organizmlar genomlarini sekvenirlanganligini inobatga oladigan bo‘lsak, bu kabi tadqiqotlarga talab kundan kunga ortib bormoqda.
Hozirgi kunda bioinformatika fani tomonidan biomolekulalarning ketma-ketliklarini aniqlash bo‘yicha ko‘plab eksperimental usullar ishlab chiqilgan. Biomolekulalar ya'ni oqsillar, nuklein kislotalarning ketma-ketliklarini analiz qilish ularning tabiati haqidagi tasavvurlarning kengayishiga, ularning funksiyasini to‘laqonli ravishda tushunishga, ularning fazoviy modellarni yaratishga zamin yaratadi. Turli organizmlarga xos bo‘lgan genomlarning aniqlanishi, ularning vazifalarining o‘rganilishi esa bu organizmlarning evolyusion kelib chiqishi haqidagi ma'lumotlarning yanada boyishiga olib keladi.
Zamonaviy fan sifatida yaqin yillarda paydo bo‘lgan genomikaning tez rivojlanishini birinchi tomondan DNK dagi nukleotidlar ketma-ketliklarining aniqlanishi ya'ni sekvinirlanish usullarining takomillashib borishi bilan bo‘lsa, ikkinchi tomondan biomolekulalar ketma – ketliklari haqidagi juda katta hajmdagi axborotlarning paydo bo‘lishi natijasida ularni tahlil qilish uchun zarur bo‘lgan zamonaviy komp'yuter usullarining yaratilishi bilan tushuntirish mumkin.
Ma'lumotlar bazalari:
• Arxivli ( PDB, GenBank) har bir kiritilgan ma'lumot uchun muallif-tadqiqotchi javob beradi
• Nazorat qilinuvchi ma'lumotlar uchun maxsus odamlar – kuratorlar javob beradilar
• Avtomatik ma'lumotlar komp'yuter dasturlari tomonidan yaratiladi.
• Swiss- Prot – Oqsillarning aminokislota ketma-ketliklarini saqlovchi baza
• KEGG – metabolizm haqidagi ma'lumotlar
• FlyBase –Drosophila haqidagi ma'lumotlar
• COG – ortologik genlar haqidagi ma'lumotlar.
• COP – Oqsillarning strukturaviy klassifikasiyasi
• PFAM – Oqsil oilalari bo‘yicha ma'lumotlar banki
• GO (Gene Ontology) – Genlar klassifikasiyasi
• ProDom – Oqsil domenlari
• AsMamDB – Sutemizuvchilardagi al'ternativ splaysing
• NCBI Entrez – Nukleotid yoki aminokislotalar ketma-ketliklari haqidagi ma'lumotlarga kirish
• Ecocyc – barchasi E. coli haqida – genlar, oqsillar, metabolizm va boshqalar.
Asosiy molekulyar-genetik ma'lumotlar bazalari. Molekulyar-genetik MB ning ob'ektlari sifatida nukleotidli, aminokislotali ketma – ketliklar, genetik xaritalar, fermentlar, nukleotid zondlar va boshqalar hisoblanadi.
Biotexnologik ma'lumotlar Milliy Markazi (AQSh) (ingl. National Center of Biotechnological Information, NCBI) 1988 yilda Betes (Merilend shtati, AQSh) da molekulyar biologiya ma'lumotlarini saqlovchi va qayta tahlil qiluvchi markaz sifatida joriy etilgan edi. AQSh Milliy Sog‘liq institutining (National Institute of Health, NIH) tarkibiga kiruvchi AQSh Milliy Tibbiyot kutubxonasi (United States National Library of Medicine, NLM)ning bir qismi hisoblanadi.
NCBI oqsil domenlari, DNK (GenBank) va RNK haqidagi va ilmiy maqolalar haqidagi (PubMed) ma'lumotlar bazalari haqida ma'lumot beradi.
Shuningdek, NCBI ma'lumotlar bazasining tarkibida oqsillar yoki nuklein kislotalarning ketma – ketliklarini taqqoslashga mo‘ljallangan BLAST dasturlar majmuasi ham mavjud.
Nukleotidlarning ketma – ketliklari bo‘yicha hozirgi kunda axborot hajmi jihatidan yirik ma'lumotlar bazalari quyidagilar hisoblanadi:
GenVank – genetik ketma – ketliklar ma'lumotlar bazalari hisoblanadi va NIH (Milliy Sog‘liq Instituti, AQSh) tomonidan qo‘llab quvvatlanadi. Bu MB sining tarkibiga DNK va RNK va oqsillarning ketma – ketliklari haqidagi axborotlar kiradi. Uning tarkibidagi ma'lumotlar har ikki oyda bir marotaba yangilanib turiladi va uchta yirik nukleotidlar ketma-ketliklari ma'lumotlar bazasini (DDBJ, EMBL, GenBank (NCBI)) birlashtiruvchi International Nucleotide Sequence Database Collaboration ning tarkibiy qismi hisoblanadi. Bu uchta tashkilot xalqaro mehnat taqsimoti bo‘yicha ish olib boradi va har kunlik olingan yangi axborotlarni almashinishadi.
EMBL – European Molecular Biology Laboratory. Yevropa Molekulyar Biologiya Laboratoriyasining nukleotidlar ketma – ketliklari ma'lumotlar bazasi hisoblanadi. DNK yoki RNK fragmentlarining birlamchi strukturalarini aniqlashga doir ma'lumotlar bilan muntazam ravishda to‘ldirilib boriladi. Bu MB ga 1982 yilda asos solingan. DDBJ - DNA Data Bank of Japan. EMBL (Evropa) va NCBI (AQSh) bilan doimiy aloqada bo‘lgan DNK nukleotidlari ketma – ketliklari bo‘yicha Yaponiyaning ma'lumotlar bazasi hisoblanadi. Bu ma'lumotlar bazasiga 1984 yilda Milliy genetika instituti qoshidagi informasion biologiya markazi tomonidan asos solingan (Mishima, Japan). DDBJ MB ga axborotlar birinchi navbatda yaponiyalik olimlar tomonidan taqdim etiladi. MB da yig‘ilgan umumiy axborotlarning 75 % sekvenirlangan DNK qismlari va EST (Expressed Sequence Tags) deb nomlanuvchi ekspressiyalangan genlar haqidagi ma'lumotlar hisoblanadi.
Nukleotidlar ketma-ketliklari bo‘yicha ma'lumotlarni saqlovchi ma'lumotlar bazalari singari aminokislotalar ketma-ketligi bo‘yicha ham ma'lumotlar bazalari yaratilgan. Ularda aminokislotalarning ketma-ketlik tarzi, oqsilning umumiy ma'lumotlari keltiriladi. Hozirgi kunda aminokislotalar ketma-ketligi bo‘yicha quyidagi MB faoliyat yuritib kelmoqda:
SWISS-PROT bu EMBL MB dan olingan ma'lumotlar asosida yaratilgan. Agarda aminokislotalarning ketma-ketligi haqidagi ma'lumotlar yetarli bo‘lgan sharoitda bu ma'lumotlar SWISS-PROT bazasiga kiritiladi, aks holda esa TREMBL bazasiga kiritiladi.
TREMBL bu peptid zanjiri haqida yetarlicha ma'lumotlar yig‘ilguniga qadar u haqidagi axborotlarni saqlaydi va ma'lumotlar to‘latilganidan so‘ng SWISS-PROT ga kiritiladi.
UniProt – oqsillarning aminokislotalar ketma – ketliklari va ularning funksiyalari haqidagi axborotlarni saqlovchi ma'lumotlar bazasi bo‘lib hisoblanadi. UniProt – Yevropa bioinformatika instituti (EBI), Shveysariya bioinformatika instituti (SIB) va Oqsil informasion resurslar instituti (PIR) tomonidan tashkil etilgan. EBI, SIB va PIR 2002 yilda birlashgan holda UniProt Konsorsiumiga asos solishgan.
MetaBase ma'lumotlar bazasi – barcha biologik ma'lumotlar bazasiga doir ma'lumotlar bazasi bo‘lib, tarkibida xozirgi kunda internet orqali kirish mumkin bo‘lgan barcha ma'lumotlar bazasiga bo‘yicha axborotlar saqlanadi
Xozirgi kunda MetaBase ichiga 1000 dan ortiq biologik ma'lumotlar bazasining va 800 dan ortiq “veb-xizmat”larning tarkibiy qismlari kiradi.
Biologik ketma,ketliklarni taqqoslash asoslari. Gomologik ketma,ketliklar.
A) Genetik ketma – ketliklar tahlili Sekvenirlash natijasida qo‘lga kiritilgan ulkan ma'lumotlarni qayta ishlash bioinformatikaning asosiy vazifalaridan biri sanaladi. Genlarni bir yoki har xil tur doirasida solishtirilishi oqsillar vazifasi yoki turlar o‘rtasidagi munosabatni namoyish etishi mumkin (aynan shu ko‘rinishda Filogenetik daraxtlar tuzilishi mumkin). Xozirgi kunda milliardlab juft nukleotidlardan iborat minglab organizmlar genomi bo‘yicha qidiruvni amalga oshirish uchun komp'yuter dasturlari qo‘llaniladi.
B) Evolyusion biologiya Evolyusion biologiya turlarning kelib chiqishi, vaqt o‘tishi bilan ularning rivojlanish jarayonini o‘rganadi. Informatika evolyusion biolog olimlarga bir necha yo‘nalishlarda yordam beradi:
Katta miqdordagi organizmlar evolyusiyasini nafaqat tuzilish yoki fiziologik nuqtai nazardan, balki ularning DNKsidagi o‘zgarishlarni ham tadqiq etish;
Butun boshli genomlarni taqqoslash, bu genlar duplikasiyasi, genlarning lateral tashilishi kabi kompleks evolyusion jarayonlarni o‘rganish va bakterial o‘ziga xos faktorlarni tahmin etish imkonini beradi;
C) Genom annotasiyasi Genomikaning kontekstida annotasiya – DNK ketma –ketliklarida gen va boshqa ob'ektlarning belgilash jarayoni kabi tavsiflanadi. Genomni annotasiyalovchi birinchi dasturiy tizim birinchi marotaba erkin yashovchi tirik organizm - Haemophilus influensae bakteriyasini genomini sekvenirlab, tahlil etib bergan gurux ishtirokchisi Ouen Uayt (ingl. Owen White) tomonidan 1995 yilda yaratilgan. Doktor Uayt genlar, tRNK va DNKning boshqa ob'ektlarini izlab topuvchi tizimni yaratdi va ushbu genlar vazifasiga birinchi marotaba tushuntirishlar kiritib o‘tdi. Ko‘pchilik zamonaviy tizimlar ham shunga o‘xshash tarzda ishlaydi, lekin bu dasturlar doimiy ravishda yangilanib va yaxshilanib boriladi.
D) Biologik xilma – xillikni baholash. Ekotizimning biologik xilma hilligi – aniq bir muhitni tashkil etuvchi, istiqomat qiluvchi barcha turlarning to‘liq genetik yig‘indisi kabi aniqlanishi mumkin. Ushbu soxaning eng muhim potensiallaridan biri – bu nobud bo‘lib borayotgan turlarning DNK ketma – ketligi yoxud butun genomining tahlil etilishi sanaladi. Bunda o‘sha turning genetik ma'lumotlari komp'yuterda saqlanib qoladi va kelajakda ushbu tur butunlay yo‘qolib ketgan taqdirda ham uning ma'lumotlaridan foydalanish imkoni bo‘ladi.
21-asrning boshlarida olimlar bir qator hayratlanarli narsalarni modellashtirish va kuzatish uchun bioinformatikadan foydalanishga imkon berib, butun turlarning genomlarini ketma-ketlikda va kompyuterlarda saqlashga kirishdilar.

Bunday dasturlardan biri turdagi evolyutsion o'zgarishlarni aniqlashdir. Genomni o'rganish va uning vaqt o'tishi bilan qanday o'zgarishini kuzatish orqali evolyutsion biologlar evolyutsiyani qanday sodir bo'lishiga qarab kuzatishi mumkin.


Bioinformatikaning eng taniqli qo'llanilishi ketma-ketlikni tahlil qilishdir. Ketma-ketlikni tahlil qilishda turli xil organizmlarning DNK sekanslari osongina olish va taqqoslash uchun ma'lumotlar bazalarida saqlanadi.
Yaxshi hisobot berilgan Inson Genom loyihasi bioinformatikaning ketma-ketligini tahlil qilishning namunasidir. Katta kompyuterlar va ketma-ketlikni yig'ishning turli usullari yordamida butun inson genomi ketma-ketlikda tuzilgan va ma'lumotlar bazasida saqlangan.
Bioinformatika uchun ishlatiladigan DNK ketma-ketliklarini bir necha usullar bilan to'plash mumkin. Usullardan biri - genomni bosib o'tish va ro'yxatga olish va saqlash uchun alohida ketma-ketliklarni qidirish.
Yana bir usul - bu shunchaki katta qismlarni olish va ularning hammasini taqqoslash, keraksiz segmentlar ustidagi barcha ketma-ketliklarni topish.
Ov miltig'ini ketma-ketligi deb nomlanadigan so'nggi usul, hozirgi vaqtda eng qulay va tezkorligi tufayli eng mashhur hisoblanadi.
Genomning ma'lum ketma-ketliklarini o'ziga xos mutatsiyalar bilan taqqoslash orqali saraton kabi istalmagan mutatsiyalar haqida ko'p ma'lumotlarga ega bo'lish mumkin.
Inson genomini to'liq xaritalash bilan bioinformatika oxir-oqibat davolanish umidida saraton tadqiqotlarida juda muhim ahamiyatga ega bo'ldi.
Kompyuterlar turlarning kengroq ma'lumotlarini yig'ish va saqlash uchun ham foydalaniladi. Masalan, "Turlar" loyihasi 2000 yilda Yerdagi barcha o'simliklar, zamburug'lar va hayvonlar turlari to'g'risida katta hajmdagi ma'lumotlarni to'plash maqsad qilingan. Ushbu ma'lumot bir qator dasturlarda, jumladan populyatsiyalar va biomlarning o'zgarishini kuzatishda ishlatilishi mumkin.
Bioinformatikaning ko'plab boshqa dasturlari mavjud, jumladan oqsil zanjirlarini bashorat qilish, genlarning har xil turlarda qanday ifodalanishini o'rganish va butun hujayralarning murakkab modellarini yaratish.
Hisoblash quvvati oshib, bizning genetik va molekulyar ma'lumotlar bazalarimiz kengayib borayotganligi sababli, bioinformatika sohasi shubhasiz o'sib boradi va o'zgarib boradi, bu bizga juda murakkab va foydali modellarni yaratishga imkon beradi.

Gerxardt (2001) ma'lumotlariga ko'ra, bioinformatika serbiyalik Neshichning kelishi bilan kashshof bo'lgan, u erda u Braziliya olimlarining birinchi aloqalarini ta'minlagan 1992 yilda tashkil topgan BBNet (BrazilianBioNet) loyihasi, bioinformatika foydalanuvchilari tarmog'i. Embrapa genetik resurslari va biotexnologiyasining kompyuter (server) orqali DNK ketma-ketligini tahlil qilish dasturlariga bepul.
Ushbu loyihadan keyin ko'plab boshqalar paydo bo'ldi, shuningdek, Levining (2002) maqolasida aytib o'tilganidek, maxsus laboratoriya ishlarini olib boradigan ixtisoslashgan markazlarning qurilishi paydo bo'ldi, bu erda NBI (Bioinformatika markazi) ning qurilishi haqidagi murakkab laboratoriya ochilgan. UNICAMP binosi. Kompyuterlarda Sting deb nomlangan milliy dasturiy ta'minot orqali amalga oshirilgan simulyatsiyalar orqali bu strukturaviy va funktsional genomlarni o'rganishga imkon beradi.
Shuningdek, AB3C (Braziliya bioinformatika va hisoblash biologiyasi assotsiatsiyasi) yaratildi, u biologiya, tibbiyot, informatika va boshqalar kabi tegishli sohalardagi turli mutaxassislarning o'zaro aloqalarini rivojlantirishga qaratilgan. Bioinformatika Braziliyada elektron tizimlar muhandisligi kafedrasi - PSI / EPUSP tomonidan aytib o'tilganidek, ma'lum bir muammoni hal qilish uchun umumiy maqsadga ega bo'lgan o'quv guruhlari bilan bog'liq bir nechta loyihalarni amalga oshirmoqda, bu erda har biri muayyan muammoga echim izlaydigan 5 guruh mavjud
Braziliyada bioinformatikani tarqatishga yordam beradigan yana bir dastur - bu Onsa tarmog'i (Nukleotidlarni tartiblashtirish va tahlil qilish tashkiloti), bu tegishli muassasalar bilan virtual va dinamik o'rganishga imkon berdi.

Xulosa
UniProt – oqsillarning aminokislotalar ketma – ketliklari va ularning funksiyalari haqidagi axborotlarni saqlovchi ma'lumotlar bazasi bo‘lib hisoblanadi. UniProt – Yevropa bioinformatika instituti (EBI), Shveysariya bioinformatika instituti (SIB) va Oqsil informasion resurslar instituti (PIR) tomonidan tashkil etilgan. EBI, SIB va PIR 2002 yilda birlashgan holda UniProt Konsorsiumiga asos solishganini tushundim.
Hozirgi kunda bioinformatika fani tomonidan biomolekulalarning ketma-ketliklarini aniqlash bo‘yicha ko‘plab eksperimental usullar ishlab chiqilgan. Biomolekulalar ya'ni oqsillar, nuklein kislotalarning ketma-ketliklarini analiz qilish ularning tabiati haqidagi tasavvurlarning kengayishiga, ularning funksiyasini to‘laqonli ravishda tushunishga, ularning fazoviy modellarni yaratishga zamin yaratadi. Turli organizmlarga xos bo‘lgan genomlarning aniqlanishi, ularning vazifalarining o‘rganilishi esa bu organizmlarning evolyusion kelib chiqishi haqidagi ma'lumotlarning yanada boyishiga olib kelishi haqida ma’lumotlarga ega bo‘ldim.
Zamonaviy fan sifatida yaqin yillarda paydo bo‘lgan genomikaning tez rivojlanishini birinchi tomondan DNK dagi nukleotidlar ketma-ketliklarining aniqlanishi ya'ni sekvinirlanish usullarining takomillashib borishi bilan bo‘lsa, ikkinchi tomondan biomolekulalar ketma – ketliklari haqidagi juda katta hajmdagi axborotlarning paydo bo‘lishi natijasida ularni tahlil qilish uchun zarur bo‘lgan zamonaviy komp'yuter usullarining yaratilishi bilan tushuntirish mumkinligi haqida bilib oldim.
MetaBase ma'lumotlar bazasi – barcha biologik ma'lumotlar bazasiga doir ma'lumotlar bazasi bo‘lib, tarkibida xozirgi kunda internet orqali kirish mumkin bo‘lgan barcha ma'lumotlar bazasiga bo‘yicha axborotlar saqlanadi
Xozirgi kunda MetaBase ichiga 1000 dan ortiq biologik ma'lumotlar bazasining va 800 dan ortiq “veb-xizmat”larning tarkibiy qismlari kiradi.
Biologik ketma,ketliklarni taqqoslash asoslari haqida ko‘p ma’lumotlarni tushundim.

Download 1.59 Mb.

Do'stlaringiz bilan baham:
  1   2




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling