I. Genomik va proteomik ma'lumotlar bazalari bilan ishlash


Download 0.92 Mb.
bet4/10
Sana16.01.2023
Hajmi0.92 Mb.
#1095017
1   2   3   4   5   6   7   8   9   10
Bog'liq
Bioinformatsion malumotlar bazasi

2. Asosiy qism:
I. Genomik va proteomik ma'lumotlar bazalari bilan ishlash
Ko'p sonli samarali dasturiy vositalar mavjud bo'lgan BIning navbatdagi vazifasi nukleotidlar yoki aminokislotalar ketma-ketligini (shu jumladan bir nechta) moslashtirishdir. Bu ketma-ketliklarning bir-birining ustiga qo'yilgan rekordidir, shunda mos keladiganlar soni maksimal bo'ladi. Shuni hisobga olish kerakki, gomologik ("bog'liq") ketma-ketliklar bir nukleotidni (aminokislotalarni) boshqasiga almashtirish yoki nukleotid yoki aminokislotalarni kiritish/o'chirish natijasida bir-biridan farq qilishi mumkin. Ushbu muammoni hal qilish quyidagi hollarda talab qilinadi: genomik (proteomik) ma'lumotlar bazasida nukleotidlar (aminokislotalar) ketma-ketligini izlash, ikki yoki undan ortiq mos keladigan ketma-ketlikni solishtirish (filogenetik tahlilda, evolyutsion konservativ hududlarni qidirish va prognozlashda). genlar va oqsillarning funktsiyalari).7
Tegishlash uchun grafikdagi optimal yo'lni topish algoritmlariga o'xshash dinamik dasturlash algoritmlari qo'llaniladi. Ular to'g'ri echimlarni beradi, lekin, ayniqsa, DNK fragmenti va butun genomni tekislashda ular ko'p vaqt talab etadi. Shuning uchun genomdagi nukleotidlar ketma-ketligini izlash uchun BLAST algoritmi (asosiy mahalliy moslashishni qidirish vositasi) ko'pincha ishlatiladi. Uning ishining mohiyati shundaki, u birinchi navbatda kesh jadvalini yaratadi. Unda 7-13 nukleotid uzunlikdagi har bir ketma-ketlik uchun uning berilgan genomda yuzaga keladigan nuqtalari ko'rsatilgan. Kerakli ketma-ketlikni tekislashda (ularning uzunligi, qoida tariqasida, jadval ketma-ketliklarining uzunligidan sezilarli darajada oshadi) u qisqa bo'laklarga bo'linadi, ularning genomidagi joylashuvi kesh jadvali yordamida aniqlanadi. Shundan so'ng, tekislash grafikdagi yo'llarni topish algoritmlari yordamida amalga oshiriladi, ammo moslikni qidirish butun baza bo'ylab emas, balki faqat birinchi bosqichda tanlangan qismlari bo'yicha amalga oshirilganligi sababli, natija ancha tez erishiladi.
Agar bir vaqtning o'zida bir nechta shunga o'xshash ketma-ketlikni tekislash kerak bo'lsa, vaqtni tejash uchun progressiv tekislash deb ataladigan biroz soddalashtirilgan yondashuv qo'llaniladi. Uning mohiyati shundan iboratki, birinchi navbatda ikkita eng o'xshash ketma-ketlik tekislanadi va bu tekislash natijalariga ko'ra keyingi bosqichda u qurilgan ikkita ketma-ketlikni almashtiradigan supersequent quriladi. Ikki eng o'xshash ketma-ketlik yana qidiriladi va hokazo. Nihoyat, kiritilgan barcha ketma-ketliklarning hizalanishi olinadi.8
Yana bir qiziqarli va hali to'liq hal etilmagan muammo - bu genlar va turli tartibga soluvchi hududlarni aniqlash va ularning funktsiyalarini aniqlash uchun mavjud genom ketma-ketligini tahlil qilish. Birinchi eukaryotik genomning ketma-ketligidan oldin ham, bu organizmlarda prokaryotik bakteriyalardan farqli o'laroq, butun genomdan uzoqroqda genlar mavjud, ammo muhim intergenik hududlar ham mavjud. Shunday qilib, o'z-o'zidan eukaryotik genomlarning nukleotidlar ketma-ketligini aniqlash tadqiqotchilarga nisbatan kam ma'lumot berdi. Ushbu ma'lumotlarning barchasida genlarga mos keladigan hududlarni va ularning ishini tartibga soluvchi hududlarni (odam genomida ular yig'indisi 30% dan ko'p bo'lmagan) topish, ma'lum bir gen qanday vazifani bajarishini aniqlash kerak edi. bajaradi va qanday sharoitda ishlaydi va nimada - Yo'q. Ushbu muammoni hal qilish turli organizmlarning turli genlarining ketma-ketligi va funktsiyalari bo'yicha eksperimental ma'lumotlar mavjudligi tufayli mumkin bo'ldi. Ularni tahlil qilgandan so'ng, siz barcha genlarga yoki ularning katta guruhiga xos bo'lgan markerlarni aniqlashga harakat qilishingiz mumkin, bu ularni gen bo'lmagan DNKdan ajratish imkonini beradi. Ko'pgina genlar uchun bunday belgilar topilgan. Ular genning boshida ko'p yoki kamroq saqlanib qolgan nukleotidlar ketma-ketligidir. Agar ushbu markerlarga qo'shimcha ravishda, odatda genlar bilan bog'liq bo'lgan boshqa ketma-ketliklarning mavjudligi tahlil qilinsa, shuningdek, taxminiy genni transkripsiyalash va tarjima qilish mumkinligini tekshirsa, har qanday genomda genlarning umumiy sonini taxmin qilish va ularning joylashishini topish mumkin. . Shunday qilib, ushbu yondashuv tufayli odamda 22 000 ga yaqin gen borligi aniqlandi. Biroq, bu ishning faqat boshlanishi. Gen kashf etilgandan so'ng, uning vazifasi (nima qiladi?) va uni tartibga solish xususiyatlari (bu gen qachon, qaysi turdagi hujayralarda va qanday sharoitda ishlaydi?) haqida savol tug'iladi. Gen funktsiyasini aniqlash uchun uning ketma-ketligi ma'lum funktsiyaga ega bo'lgan boshqa genlar (bir xil va boshqa organizmlar) ketma-ketligi bilan taqqoslanadi. Agar muhim homologiya topilsa, xarakterli gen o'xshash bo'lgan gen bilan bir xil funktsiyaga ega bo'lishi mumkin.9 Bunday dasturlarni yaratishda ularning ish sifati ularga funktsiyalari allaqachon eksperimental ravishda aniqlangan gen ketma-ketligini kiritish orqali tekshiriladi. Agar dastur bunday genning funktsiyasini to'g'ri aniqlasa, u ishonchli ishlaydi. Biroq, nukleotidlar ketma-ketligini taqqoslashga asoslangan yondashuv ma'lum qiyinchiliklarga duch keladi: birinchidan, hujayralardagi haqiqiy ish genlarning o'zlari tomonidan emas, balki ularning mahsulotlari tomonidan amalga oshiriladi, qoida tariqasida, bu oqsillardir. Genetik kodning degeneratsiyasi tufayli juda boshqacha nukleotidlar ketma-ketligiga ega bo'lgan ikkita gen aminokislotalar ketma-ketligida o'xshash oqsillarni ishlab chiqarishi mumkin. Ikkinchidan, oqsilning vazifasi uning aminokislotalar ketma-ketligi (birlamchi tuzilishi) bilan emas, balki uning fazoviy tashkil etilishi (ikkilamchi, uchinchi va to'rtlamchi tuzilmalar) bilan belgilanadi. Shunga ko'ra, gen funktsiyasini aniqlashning eng to'g'ri yondashuvi uning oqsil mahsuloti va oqsillarining potentsial uch o'lchovli tuzilishini ma'lum uch o'lchovli tuzilishi va funktsiyasi bilan solishtirishdir. Va bu allaqachon ketma-ketliklarni taqqoslashdan ko'ra ancha qiyin vazifadir, chunki bir tomondan, mavjud matematik modellar har doim ham mavjud aminokislotalar ketma-ketligiga ko'ra oqsilning uch o'lchovli tuzilishini to'g'ri qurmaydi, boshqa tomondan. qo'l, uch o'lchovli tuzilishga ega bo'lgan oqsillar soni juda katta emas. Shunday qilib, oqsillarning uch o'lchovli tuzilishini modellashtirish (bular quyida muhokama qilinadi) va genlarning funktsiyalarini aniqlash hisoblash biologiyasi va BI rivojlanishining istiqbollaridan biri bo'lgan vazifalardir.

Download 0.92 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling