Mundarija: Kirish I. Bob. Zamonaviy bioinformatsion ma'lumotlar asoslari


Uchinchi tur - olingan ma'lumotlar bazalari. Bunday ma'lumotlar bazalari arxivlangan va kuratsiyalangan ma'lumotlar bazalaridan ma'lumotlarni qayta ishlash natijasida olinadi. Bunga quyidagilar kiradi


Download 0.73 Mb.
bet5/13
Sana15.11.2023
Hajmi0.73 Mb.
#1776103
1   2   3   4   5   6   7   8   9   ...   13
Bog'liq
Mundarija Kirish I. Bob. Zamonaviy bioinformatsion ma\'lumotlar

Uchinchi tur - olingan ma'lumotlar bazalari. Bunday ma'lumotlar bazalari arxivlangan va kuratsiyalangan ma'lumotlar bazalaridan ma'lumotlarni qayta ishlash natijasida olinadi. Bunga quyidagilar kiradi:


  • SCOP - Proteinlarning strukturaviy tasnifi ma'lumotlar bazasi (oqsillarning tuzilishini tavsiflaydi)

  • PFAM - Proteinlar oilasi ma'lumotlar bazasi

  • GO (gen ontologiyasi) – genlar tasnifi (bir gen turlicha nomlanmasligi va turli genlarga bir xil nom berilmasligi uchun terminologiyani tartiblash, atamalar to‘plamini yaratishga urinish)

  • ProDom - oqsil domenlari

  • AsMamDB - sutemizuvchilarda muqobil splicing

  • NCBI Entrez - nukleotidlar va aminokislotalar ketma-ketligi va tuzilmalari haqidagi ma'lumotlarga kirish

  • Ecocyc - E. coli haqida hamma narsa - genlar, oqsillar, metabolizm va boshqalar.

1.2. Zamonaviy ma’lumot bazalari bian ishlash
EMBL- Evropa molekulyar biologiya laboratoriyasi
DDBJ- Yaponiya DNK ma'lumotlar bazasi
Entrez - bu NCBI-ning qidiruv va qidiruv tizimi bo'lib, foydalanuvchilarga ketma-ketlik, xaritalash, taksonomiya va tarkibiy ma'lumotlarga yaxlit kirishni ta'minlaydi.
Zamonaviy ma'lumotlar bazalari jadval ma'lumotlari bilan ishlashga moslashtirilgan relyatsion ma'lumotlar bazalari asosida yaratiladi, shuning uchun oson rasmiylashtiriladigan ma'lumotlar (jadval ko'rinishida taqdim etiladi) ma'lumotlar bazasiga kiritiladi. Murakkab biologik tizimlar to'g'risida ma'lumotni to'liq rasmiylashtirish deyarli mumkin emas; - Ma'lumotlar bazasi to'liq qayta tuzilishga imkon beradigan darajada moslashuvchan bo'lishi kerak, chunki dinamik ravishda to'ldiriladigan ma'lumotlar bazasining batafsil tuzilishini oldindan tuzish mumkin emas. Ushbu talab molekulyar biologiya sohasidagi bilimlarning dinamik ravishda rivojlanib borayotganligidan kelib chiqadi va uni kompyuterda ishlash uchun qulay bo'lgan har qanday oldindan ishlab chiqilgan qattiq tizimda tasvirlash juda qiyin: - chunki maxsus xalqaro ma'lumotlar bazalarida turli xil xalqaro ma'lumotlar bazalarida taqdim etilgan ma'lumotlar ma'lumotlar bazasiga birlashtirilishi kerak. formatlar, ma'lumotlar bazasi nafaqat standart multimedia formatlarini, balki bir qator maxsus formatlarni (fazoviy molekulyar tuzilmalar, kimyoviy struktura) qo'llab-quvvatlaydigan gipermedia muhitida yaratilishi kerak. e formula boshqalar) .; - ma'lumotlar bazasini ishlashi va to'ldirishi kompyuter tarmoqlari orqali o'qimagan foydalanuvchilarga (biologlar, shifokorlar) kompyuter tarmoqlari orqali osonlikcha kirishi kerak.
Ushbu xususiyatlardan foydalangan holda biz ba'zi bir ma'lumotlar bazalarini taqqoslaymiz: HEFalMP (http://sonorus.princeton.edu/hefalmp) "+" a) qidiruvlarning bir nechta turlari (garchi bu ko'pgina ma'lumotlar bazalari uchun odatiy bo'lsa); b) genlarning grafik funktsional aloqalarini quradi; c) qidiruv parametrlarini o'rnatishning qulay va oson usuli; "-" bu natijalarni chiqarish uchun noqulay format. GAD (Genetik assotsiatsiya ma'lumotlar bazasi) (http://geneticassociationdb.nih.gov) "+" a) so'rov bo'yicha batafsil ma'lumotni ko'rsatish (ba'zan hatto ortiqcha); b) boshqa ma'lumotlar bazalariga qaraganda (20 kasallik kasalliklari) juda katta ro'yxatdagi kasalliklar sinfini tanlash imkoniyati; v) namunaning hajmi va kelib chiqishi hisobga olingan holda; d) natija = matnli tavsif + faol havolalarga ega jadval; e) atrof-muhit omillarining ta'sirini hisobga olish (boshqa hech qanday ma'lumotlar bazasida mavjud emas); "-" oddiy qidiruvda faqat bitta "kalit so'zlar" so'rov formati mavjud (ma'lumotlar bazasidan foydalanuvchi shifokorlar uchun bu "+" bo'lishi mumkin).
Genbankda turli organizm DNK va RNk ning ketma-ketligi mavjud.
Ma'lumotlar bazalari va dasturlar. NCBI
NCBI tarkibida kompyuter fanlari, molekulyar biologlar, matematiklar, biokimyogarlar, tadqiqotchilar va tarkibiy biologlardan hisoblangan molekulyar biologiyada asosiy va amaliy tadqiqotlar bilan shug'ullanadigan ko'p tarmoqli tadqiqot guruhi mavjud. Ushbu tergovchi nafaqat fundamental fanga muhim hissa qo'shibgina qolmay, balki amaliy tadqiqotlar uchun yangi usullarni yaratishda ham xizmat qiladi. Ular birgalikda matematik va hisoblash usullaridan foydalangan holda molekulyar darajada fundamental biomedikal muammolarni o'rganmoqdalar. Ushbu muammolarga genlarni tashkil etish, ketma-ketlik tahlili va tuzilmani bashorat qilish kiradi. Amaldagi tadqiqot loyihalarini saralash quyidagilarni o'z ichiga oladi: genlarni aniqlash va tahlil qilish, takroriy ketma-ketlik, oqsil sohalari va tarkibiy elementlar, inson genomining gen xaritasini yaratish, OIV infektsiyasining kinetikasini matematik modellashtirish, sekvensiya xatolarining ta'sirini tahlil qilish. ma'lumotlar bazasini qidirish, ma'lumotlar bazasini izlash va yangi ketma-ketlikni hizalanish uchun yangi algoritmlarni ishlab chiqish, keraksiz ketma-ketliksiz ma'lumotlar bazalarini qurish, ketma-ket o'xshashlikning statistik ahamiyatini baholashning matematik modellari va matnni olish uchun vektorli modellar. Bundan tashqari, NCBI tergovchilari NIH tarkibidagi bir nechta institutlar, shuningdek, ko'plab akademik va hukumat ilmiy laboratoriyalari bilan doimiy hamkorlik qilib kelmoqdalar.1992 yil oktyabr oyida NCBI GenBank DNK ketma-ket bazasi uchun javobgarlikni o'z zimmasiga oldi. NCBI xodimlari molekulyar biologiya bo'yicha malaka oshirgan bazani individual laboratoriyalar tomonidan taqdim etilgan ketma-ketliklar va xalqaro nukleotidlar ketma-ketligi ma'lumotlar bazasi, Evropa molekulyar biologiya laboratoriyasi (EMBL) va ma'lumotlar bilan ma'lumot almashish orqali yaratadilar. Yaponiya DNK ma'lumotlar bazasi (DDBJ). AQSh Patent va savdo markasi idorasi bilan kelishuvlar patentlangan ketma-ketlik ma'lumotlarini birlashtirishga imkon beradi. GenBankdan tashqari, NCBI tibbiy va ilmiy hamjamiyatlari uchun turli xil ma'lumotlar bazalarini qo'llab-quvvatlaydi va tarqatadi. Bularga onlaynda Mendeliya merosxo'rligi (OMIM), 3D oqsil tuzilmalarining molekulyar modellashtirish ma'lumotlar bazasi (MMDB), inson genomining gen xaritasi, taksonomiya brauzeri va saraton genom anatomiyasi loyihasi (CGAP) bilan hamkorlikda kiradi. Milliy Saraton Instituti.
Entrez - bu NCBI-ning qidiruv va qidiruv tizimi bo'lib, foydalanuvchilarga ketma-ketlik, xaritalash, taksonomiya va tarkibiy ma'lumotlarga yaxlit kirishni ta'minlaydi. Entrez shuningdek ketma-ketliklar va xromosoma xaritalarining grafik ko'rinishini taqdim etadi. Entrezning kuchli va o'ziga xos xususiyati - tegishli ketma-ketliklar, tuzilmalar va havolalarni olish. Jurnal adabiyotlari MEDLINE-da 11 milliondan ortiq jurnallarga kirishni ta'minlovchi va ishtirok etuvchi nashriyotlarning veb-saytlarida to'liq matnli maqolalarga havolalarni o'z ichiga olgan PubMed veb-qidiruv interfeysi orqali mavjud.
Genbankning tuzilshi
- Locus- nomi nukleotid ketma-ketligi uzuligi, va uning tuzilishi halqali yoki chiziqli
-Definition –gen haqida qisqacha ma’lumot
- Accession- identifikator nomeri obyektning
- Version-
- Keywords- atamalar ro’yxati;
- Sourse- organizmning to’liq nomlanishi,
-Organism- o’rganiayotgan organizmning to’liq toksonomik identifikatsiyasi
-Reference- adabiyotlar
- Comment- komentariya



Download 0.73 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   13




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling