Kurs ishi mavzu: Oqsil ketma-ketliklari bazalari (swiss-prot)


Download 184.51 Kb.
bet6/22
Sana07.02.2023
Hajmi184.51 Kb.
#1174896
1   2   3   4   5   6   7   8   9   ...   22
Bog'liq
183-Shokirova Shamsiya. OQSIL KETMA-KETLIKLARI BAZALARI (SWISS-PROT).

UniRef.


TrEMBL Reference Clusters (UniRef) TrEMBLKB va tanlangan UniParc yozuvlaridan olingan oqsil ketma-ketliklarining klasterli to'plamining uchta ma'lumotlar bazasidan iborat. UniRef100 ma'lumotlar bazasi bir xil ketma-ketliklarni va ketma-ketlik qismlarini (har qanday organizmdan ) yagona UniRef yozuviga birlashtiradi. Vakil oqsilning ketma-ketligi, barcha birlashtirilgan yozuvlarning kirish raqamlari va tegishli TrEMBLKB va UniParc yozuvlariga havolalar ko'rsatiladi. UniRef100 ketma-ketliklari CD-HIT algoritmi yordamida UniRef90 va UniRef50 ni yaratish uchun klasterlangan. [22] [23]Har bir klaster eng uzun ketma-ketlikka mos ravishda kamida 90% yoki 50% ketma-ketlik identifikatsiyasiga ega bo'lgan ketma-ketliklardan iborat. Klasterlash ketma-ketligi ma'lumotlar bazasi hajmini sezilarli darajada kamaytiradi, bu esa ketma-ketlikni tezroq qidirishga imkon beradi.


2.2. SWISS-PROT protein ketma-ketligi ma'lumotlar bazasi va uning qo'shimchasi TreEMBL 2000 yilda
SWISS-PROT - oqsillar ketma-ketligi ma'lumotlar bazasi bo'lib, u yuqori darajadagi izohni (masalan, oqsil funktsiyasining tavsifi, uning domenlari tuzilishi, translatsiyadan keyingi modifikatsiyalari, variantlari va boshqalar), ortiqcha minimal darajasini ta'minlashga intiladi. va boshqa ma'lumotlar bazalari bilan yuqori darajadagi integratsiya. Ma'lumotlar bazasining so'nggi ishlanmalari format va tarkibni yaxshilash, qo'shimcha ma'lumotlar bazalariga o'zaro havolalar, yangi hujjat fayllari va SWISS-PROT ga kompyuter izohli qo'shimchasi bo'lgan TrEMBL yaxshilanishlarini o'z ichiga oladi. TrEMBL EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasidagi barcha kodlash ketma-ketliklarining (CDS) tarjimasidan olingan SWISS-PROT-ga o'xshash formatdagi yozuvlardan iborat, SWISS-PROT-ga allaqachon kiritilgan CDS'lar bundan mustasno. Shuningdek, biz Inson Proteomikasi Tashabbusini (HPI) tasvirlaymiz, SWISS-PROT sifat standartlariga muvofiq barcha ma'lum inson ketma-ketliklarini izohlash bo'yicha yirik loyiha. SWISS-PROT quyidagi manzillarda mavjud: http://www.expasy.ch/sprot/ va http://www.ebi.ac.uk/swissprot/
SWISS-PROT Jeneva universiteti Tibbiyot biokimyosi kafedrasida yaratilgan va 1987 yildan beri kafedra va Yevropa molekulyar biologiya laboratoriyasining (EMBL) hamkorlikdagi sa'y-harakatlari bo'lgan izohli oqsil ketma-ketligi ma'lumotlar bazasidir. SWISS -PROT endi EMBL va Shveytsariya bioinformatika instituti (SIB) o'rtasidagi teng huquqli hamkorlikdir. EMBL faoliyati Hinxton Outstation, Yevropa bioinformatika instituti (EBI) tomonidan amalga oshiriladi.
SWISS-PROT protein ketma-ketligi ma'lumotlar bazasi ketma-ketlik yozuvlaridan iborat. Ketma-ket yozuvlar har xil chiziq turlaridan iborat bo'lib, ularning har biri o'z formatiga ega. Standartlashtirish maqsadida SWISS-PROT formati (qarang: http://www.expasy. ch/txt/userman.txt) EMBL Nukleotidlar ketma-ketligi ma'lumotlar bazasiga imkon qadar yaqinroqdir. SWISS-PROT yozuvining namunasi http://www.expasy.ch/cgi-bin/niceprot sahifasida ko'rsatilgan.
SWISS-PROT ma'lumotlar bazasi o'zini boshqa oqsillar ketma-ketligi ma'lumotlar bazalaridan uchta aniq mezon bilan ajratib turadi: (i) izohlar, (ii) minimal ortiqcha va (iii) boshqa ma'lumotlar bazalari bilan integratsiya.
SWISS-PROT-da ma'lumotlarning ikki sinfini ajratish mumkin: asosiy ma'lumotlar va izoh. Har bir ketma-ketlik kiritish uchun asosiy ma'lumotlar ketma-ketlik ma'lumotlaridan iborat; iqtibos ma'lumotlari (bibliografik manbalar) va taksonomik ma'lumotlar (oqsilning biologik manbasining tavsifi), izoh esa quyidagi elementlarning tavsifidan iborat:

• Oqsilning funksiya(lari).


• Post-tarjima modifikatsiya(lar). Masalan, uglevodlar, fosforlanish, asetillanish, GPI-langar va boshqalar.
• Domenlar va saytlar. Masalan, kaltsiyni bog'laydigan hududlar, ATP bilan bog'lanish joylari, sink barmoqlari, homeoboxlar, SH2 va SH3 domenlari va boshqalar.
• Ikkilamchi tuzilma. Masalan, alfa spiral, beta varaq va boshqalar.
• To'rtlamchi tuzilish. Masalan, homodimer, geterotrimer va boshqalar.
• Boshqa oqsillarga o'xshashligi
• Protein etishmovchiligi(lar)i bilan bog'liq kasallik(lar).
• Ketma-ket ziddiyatlar, variantlar va boshqalar.
Biz SWISS-PROT-ga iloji boricha ko'proq izoh ma'lumotlarini kiritishga harakat qilamiz. Ushbu ma'lumotni olish uchun biz yangi ketma-ketlik ma'lumotlari haqida xabar beruvchi nashrlarga qo'shimcha ravishda, oilalar yoki oqsillar guruhlari izohlarini vaqti-vaqti bilan yangilash uchun maqolalarni ko'rib chiqamiz. Biz, shuningdek, bizga oqsillarning muayyan guruhlari bo'yicha o'z sharhlari va yangilanishlarini yuborish uchun jalb qilingan tashqi ekspertlardan foydalanamiz (qarang: http://www.expasy. ch/cgi-bin/experts).
Bizning fikrimizcha, asosiy ma'lumotlarni taqdim etuvchi nashrlardan tashqari nashrlarga ham, hakamlarga ham tizimli murojaat qilish SWISS-PROTning o'ziga xos va foydali xususiyati hisoblanadi. SWISS-PROT-da izohlar asosan sharh satrlarida (CC), xususiyatlar jadvalida (FT) va kalit so'z satrlarida (KW) mavjud. Ko'pchilik sharhlar "mavzular" bo'yicha tasniflanadi; Ushbu yondashuv ma'lumotlar bazasidan ma'lum toifadagi ma'lumotlarni osongina olish imkonini beradi.
Ko'pgina ketma-ketlik ma'lumotlar bazalarida ma'lum bir protein ketma-ketligi uchun turli adabiyot hisobotlariga mos keladigan alohida yozuvlar mavjud. SWISS-PROT-da biz ma'lumotlar bazasining ortiqchaligini minimallashtirish uchun barcha ma'lumotlarni birlashtirishga harakat qilamiz. Turli xil ketma-ketlik hisobotlari o'rtasida ziddiyatlar mavjud bo'lsa, ular tegishli SWISS-PROT yozuvining xususiyatlar jadvalida ko'rsatilgan.

Download 184.51 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   22




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling