Oqsillarni identifikatsiyalash resursi (Protein Identification Resource,pir) Reja Kirish Asosiy qism. I-bob Oqsillarni identifikatsiyalash resursi


Download 456.44 Kb.
bet13/13
Sana17.06.2023
Hajmi456.44 Kb.
#1530341
1   ...   5   6   7   8   9   10   11   12   13
Kafedra mudiri: __________________

The Protein Ma `lumot Manba (PIR) hisoblanadi a o'zaro


maydalangan ommaviy manba ning oqsil informatika bu
qo'llab-quvvatlaydi genomik va proteomik tadqiqot va ilmiy-
tifik kashfiyot. PIR saqlaydi the Protein Ketma-ketlik
Ma'lumotlar bazasi (PSD), a izohli oqsil ma'lumotlar bazasi qarshi
olish ustida 283 000 ketma-ketliklar qoplash the butun
taksonomik diapazon. Oila tasniflash hisoblanadi ishlatilgan uchun
sezgir identifikatsiya qilish, izchil izohtion, va
aniqlash ning izoh xatolar. The super oila
kurasiya belgilaydi imzo domen arxitektura va
toifalarga ajratadi aʼzolik uchun yaxshilash avtomatlashtirilgan
tasniflash. Kimga kattalashtirish; ko'paytirish the miqdori ning tajriba -
tal izoh, the PIR ega rivojlangan a bibliografiya
tizimi uchun adabiyot qidirish, xaritalash, va foydalanuvchi
topshirish, va ega olib borilgan retrospektiv atribu-
tion ning iqtiboslar uchun eksperimental Xususiyatlari. PIR shuningdek
saqlaydi NREF, a ortiqcha bo'lmagan ma'lumotnoma ma'lumotlar -
asos, va iProClass, a integratsiyalashgan ma'lumotlar bazasi ning oqsil
oila, funktsiya, va tuzilishi ma'lumotmation. PIR-NREF
beradi a o'z vaqtida va tushunishsiv yig'ish ning
oqsil ketma-ketliklar, joriytly consichaqish ning Ko'proq dan
1 000 000 yozuvlar dan PIR-PSD, Shveytsariya-PROT,
TREMBL, RefSeq, GenPept, va PDB. The PIR veb
sayt (http://pir.georgetown.edu) bog‘laydi ma'lumotlar tahlil qilish -
opa-singil asboblar uchun asosida maʼlumotlarbases uchun ma `lumot
olish va bilim kashfiyot, bilan funktsional-
tashkilotlar uchun interaktiv so'roqes, kombinatsiyalar ning
ketma-ketlik va text qidirmoqes, va tartiblash va ingl
kashfiyot ning qidirmoq natijalar. The FTP sayt provideolar
ozod yuklab oling uchun PSD va NREF biweekly relizlar
va yordamchi ma'lumotlar bazalari va fayllar.
KIRISH
In buyurtma uchun ta'minlash integratsiyalashgan va Qo'shilgan qiymat oqsil
ma `lumot uchun the ilmiy jamiyat, the Protein
Ma `lumot Manba (PIR) davom etadi uchun oshirish uning uch
mayor ma'lumotlar bazalari, the Proteyn Ketma-ketce Ma'lumotlar bazasi (PSD), the
Ortiqcha bo'lmagan REFerens (NREF) ketma-ketlik ma'lumotlar bazasise, va
the integratsiyalashd Proteyn Tasniflash (iProClass) ma'lumotlar bazasi (1).
Quyidagi bo'limlar kalitni tavsiflaydi o'tgan yildagi o'zgarishlar.
PIR-PSD
The PIR-PSD hisoblanadi ommaviy domen oqsil ketma-ketlike ma'lumotlar bazasi,
qaysi curijarada oʻz ichiga oladi283 000 ta izohli va tasniflangan
yozuvlar, cojuda yaxshi the butun taksonomik diapazon. Yaqinda rivojlantirish-
ment va izohtion sa'y-harakatlar bor qaratilgan yoqilgan superfamily
tasniflash va kurasiya va bibliografiya xaritalash va
atribut.
Superoila tasniflash va curation. A noyob xarakter-
istik ning the PIR-PSD hisoblanadi the superfamily tasniflash (2) bu
provideolar keng qamrovli, non-otakrorlash, va ierarxik
klasterlash ning ketma-ketliklar uchun aks ettirmoq ularning evolyutsion munosabat -
kemalar. To mo'ynau erda improve the sifat ning avtomatlashtirilgan tasnifi-
tion, biz bor olib borilgan tizimli super oila kurasiya
bu: (i) defines the imzo domen arxitektura (raqam,
buyurtma, va turlari ning domains) xaraktertayoq ning the superfamily,
(ii) toifalarga ajratadi muntazam va sherik members uchun farqlash
ketma-ketlik yozuvlar almashish the belgisitur Xususiyatlari dan chetlab o'tishlar
(shunday kabi parchalar), va (iii) dizaynNates reprsezgir va
urug' a'zolari orasida muntazam members. Bir nechta mingva
superoilalar bor bo'lgan qo'lda kurated. The urug' a'zolari
provideo a asos uchun avtomatik joylashtirish ning yangi ketma-ketlikes ichiga
mavjud superoilalar va uchun avtomatlashtirishc avlodi mulmaslahat
ketma-ketlik hizalamalar va filogenetik daraxtlar. Curijaraga, over
99% ning PSD ketma-ketliklar bor tasniflangan ichiga oilalar ning yaqindan
bog'liq ketma-ketliklar (da kamida 45% bir xil), va over uchdan ikkisi
ning ketma-ketlikes bor sinfberilgan ichiga > 36 000 superfamiyolg'on.
Bibliography mapping va atribut. To yaxshilash the sifatli
ity ning oqsil izoh tomonidan ortib boradi the miqdori ning tajriba
aqliy tasdiqlangan ma'lumotlar bilan manba atribut, the PIR ega
rivojlangan a bibliografiya ma'lumotmation tizimi va olib borilgan
retrospektiv atribut ning adabiyot ma'lumotlar. The bibliografiya
tizimi imkon beradi varaqlash va qidirmoqing ning kengaytirilganve adabiyot
PubMed va boshqa kuratlardan barcha protein yozuvlari uchun to'planganed
molekulyar ma'lumotlar bazasises, bilan birga interfeys olimlar uchun uchun
*To whom yozishmalar kerak bo'l murojaat qilgan. Tel: þ 1 2026872121; Fbolta: þ 1 2026871662; Email: pirmail@georgetown.edu
#
2003 yil Oksford University bosing Nuklein Kislotalar Tadqiqot, 2003 yil, Vol. 31, Yo'q. 1 345–347
DOI: 10.1093/nar/gkg040
The Protein Ma `lumot Manba (PIR) hisoblanadi a o'zaro
maydalangan ommaviy manba ning oqsil informatika bu
qo'llab-quvvatlaydi genomik va proteomik tadqiqot va ilmiy-
tifik kashfiyot. PIR saqlaydi the Protein Ketma-ketlik
Ma'lumotlar bazasi (PSD), a izohli oqsil ma'lumotlar bazasi qarshi
olish ustida 283 000 ketma-ketliklar qoplash the butun
taksonomik diapazon. Oila tasniflash hisoblanadi ishlatilgan uchun
sezgir identifikatsiya qilish, izchil izohtion, va
aniqlash ning izoh xatolar. The super oila
kurasiya belgilaydi imzo domen arxitektura va
toifalarga ajratadi aʼzolik uchun yaxshilash avtomatlashtirilgan
tasniflash. Kimga kattalashtirish; ko'paytirish the miqdori ning tajriba -
tal izoh, the PIR ega rivojlangan a bibliografiya
tizimi uchun adabiyot qidirish, xaritalash, va foydalanuvchi
topshirish, va ega olib borilgan retrospektiv atribu-
tion ning iqtiboslar uchun eksperimental Xususiyatlari. PIR shuningdek
saqlaydi NREF, a ortiqcha bo'lmagan ma'lumotnoma ma'lumotlar -
asos, va iProClass, a integratsiyalashgan ma'lumotlar bazasi ning oqsil
oila, funktsiya, va tuzilishi ma'lumotmation. PIR-NREF
beradi a o'z vaqtida va tushunishsiv yig'ish ning
oqsil ketma-ketliklar, joriytly consichaqish ning Ko'proq dan
1 000 000 yozuvlar dan PIR-PSD, Shveytsariya-PROT,
TREMBL, RefSeq, GenPept, va PDB. The PIR veb
sayt (http://pir.georgetown.edu) bog‘laydi ma'lumotlar tahlil qilish -
opa-singil asboblar uchun asosida maʼlumotlarbases uchun ma `lumot
olish va bilim kashfiyot, bilan funktsional-
tashkilotlar uchun interaktiv so'roqes, kombinatsiyalar ning
ketma-ketlik va text qidirmoqes, va tartiblash va ingl
kashfiyot ning qidirmoq natijalar. The FTP sayt provideolar
ozod yuklab oling uchun PSD va NREF biweekly relizlar
va yordamchi ma'lumotlar bazalari va fayllar.
KIRISH
In buyurtma uchun ta'minlash integratsiyalashgan va Qo'shilgan qiymat oqsil
ma `lumot uchun the ilmiy jamiyat, the Protein
Ma `lumot Manba (PIR) davom etadi uchun oshirish uning uch
mayor ma'lumotlar bazalari, the Proteyn Ketma-ketce Ma'lumotlar bazasi (PSD), the
Ortiqcha bo'lmagan REFerens (NREF) ketma-ketlik ma'lumotlar bazasise, va
the integratsiyalashd Proteyn Tasniflash (iProClass) ma'lumotlar bazasi (1).
Quyidagi bo'limlar kalitni tavsiflaydi o'tgan yildagi o'zgarishlar.
PIR-PSD
The PIR-PSD hisoblanadi ommaviy domen oqsil ketma-ketlike ma'lumotlar bazasi,
qaysi curijarada oʻz ichiga oladi283 000 ta izohli va tasniflangan
yozuvlar, cojuda yaxshi the butun taksonomik diapazon. Yaqinda rivojlantirish-
ment va izohtion sa'y-harakatlar bor qaratilgan yoqilgan superfamily
tasniflash va kurasiya va bibliografiya xaritalash va
atribut.
Superoila tasniflash va curation. A noyob xarakter-
istik ning the PIR-PSD hisoblanadi the superfamily tasniflash (2) bu
provideolar keng qamrovli, non-otakrorlash, va ierarxik
klasterlash ning ketma-ketliklar uchun aks ettirmoq ularning evolyutsion munosabat -
kemalar. To mo'ynau erda improve the sifat ning avtomatlashtirilgan tasnifi-
tion, biz bor olib borilgan tizimli super oila kurasiya
bu: (i) defines the imzo domen arxitektura (raqam,
buyurtma, va turlari ning domains) xaraktertayoq ning the superfamily,
(ii) toifalarga ajratadi muntazam va sherik members uchun farqlash
ketma-ketlik yozuvlar almashish the belgisitur Xususiyatlari dan chetlab o'tishlar
(shunday kabi parchalar), va (iii) dizaynNates reprsezgir va
urug' a'zolari orasida muntazam members. Bir nechta mingva
superoilalar bor bo'lgan qo'lda kurated. The urug' a'zolari
provideo a asos uchun avtomatik joylashtirish ning yangi ketma-ketlikes ichiga
mavjud superoilalar va uchun avtomatlashtirishc avlodi mulmaslahat
ketma-ketlik hizalamalar va filogenetik daraxtlar. Curijaraga, over
99% ning PSD ketma-ketliklar bor tasniflangan ichiga oilalar ning yaqindan
bog'liq ketma-ketliklar (da kamida 45% bir xil), va over uchdan ikkisi
ning ketma-ketlikes bor sinfberilgan ichiga > 36 000 superfamiyolg'on.
Bibliography mapping va atribut. To yaxshilash the sifatli
ity ning oqsil izoh tomonidan ortib boradi the miqdori ning tajriba
aqliy tasdiqlangan ma'lumotlar bilan manba atribut, the PIR ega
rivojlangan a bibliografiya ma'lumotmation tizimi va olib borilgan
retrospektiv atribut ning adabiyot ma'lumotlar. The bibliografiya
tizimi imkon beradi varaqlash va qidirmoqing ning kengaytirilganve adabiyot
PubMed va boshqa kuratlardan barcha protein yozuvlari uchun to'planganed
molekulyar ma'lumotlar bazasises, bilan birga interfeys olimlar uchun uchun
*To whom yozishmalar kerak bo'l murojaat qilgan. Tel: þ 1 2026872121; Fbolta: þ 1 2026871662; Email: pirmail@georgetown.edu
#
2003 yil Oksford University bosing Nuklein Kislotalar Tadqiqot, 2003 yil, Vol. 31, Yo'q. 1 345–347
DOI: 10.1093/nar/gkg040
turkumlash va topshirish savodliu ma `lumot uchun xaritaga tushirilgan tarafdori
paychalar. In PIR-PSD, oqsil xususiyatlari kabi kabi bog'lash saytlar, tuzilmalar
tural motivlar, va post-tarjima modifikatsiyalar _ _ bor teglangan
bilan " eksperimental " holat uchun eksperimental tarzda aniqlashed
Xususiyatlari uchun farqlash dan bular bu bor hisoblashly
bashorat qilingan; Qanaqasigahar doim, ular bor edi emas bo'lgan bog'langan bilan adabiyot -
tur iqtiboslar. A tizimematik qo'llanma atribut ning eksperimental
Xususiyatlari hisoblanadi bo'lish mashinasurildi tashqariga bilan kompyuter yordamida mapping
uchun mavjud oqsil bibliografik ma `lumot. Shunday qilib uzoq, a oz
ming eksperimental features have bo'lgan bog'langan bilan
nashrlar.
PIR-NREF DATABASE
The PIR-NREF beradi a o'z vaqtida va keng qamrovli yig'im-
tion ning oqsil ketma-ketlike ma'lumotlar, saqlash sur'at bilan the genome
ketma-ketlik loyihalar va o'z ichiga oladining manba atribut va
minimal redundancy. The ma'lumotlar bazasi o'z ichiga oladi hammasi ketma-ketlikes ichida
PIR-PSD, Shveytsariya-PROT (3), TrEMBL (3), RefSeq (4),
GenPept, va PDB (5), jami Ko'proq dan 1 000 000 yozuvlar
curijaraga. Bir xil ketma-ketliklar dan the bir xil manba organizm
(turlar) xabar berdi ichida boshqacha ma'lumotlar bazalari bor taqdim etishted kabi a
yagona NREF kirishy bilan oqsil identifikatorlar, qo'shilish raqamlar, va
Har bir asosiy ma'lumotlar bazasidan protein nomlari, w kabiamino kabi
kislota ketma-ketlik, taksonomy, va kompozitsion bibliografik ma'lumotlar.
Shuningdek sanab o'tilgan bor bog'liq ketma-ketliklar aniqlangan _ _ tomonidan yanahamma narsa
FASTQidiruv (6), shu jumladan, har xildan bir xil ketma-ketliklar
organizmlar, bir xil pastki ketma-ketliklar, va juda o'xshash
ketma-ketliklar (  95% identifikatory). NREF mumkin bo'l ishlatilgan uchun ketma-ketlik
qidirish va oqsil identifikatsiya _ _ qarshi the butun
ketma-ketlik yig'ish yoki a pastki to'plam ning bitta yoki Ko'proq genomlar.
The kollektiv oqsil ismlar, shu jumladan sinonimlar, va the
bibliografik ma `lumot mumkin bo'l ishlatilgan uchun rivojlantirish a oqsil
nomi ontologiya. The boshqacha oqsil ismlar tayinlangan tomonidan
boshqacha ma'lumotlar bazasises may Yordam aniqlash izohtion errors, ayniqsa
sially bular natijating dan keng ko'lamli genomik izoh.
MAVJUDLIGI
PIR veb sayt. The PIR web sayt bog‘laydi ma'lumotlar kon va
ketma-ketlik tahlil asbobs uchun asosida ma'lumotlar bazalari uchun ma'lumotma-
tion olishal va bilamanpaypoq kashfiyot, bilan funksionallik
uchun interaktiv so'rovlar, kombinatsiyalar ning ketma-ketlike va izoh-
tion matn qidirish, va sorting va visual kashfiyot ning qidirmoq
natijalar. The uch asosiy ma'lumotlar bazasises (PSD, NREF va iProClass)
primi ifodalaydikirish nuqtalari PIR veb-saytida, hammasi qaysi
provideo matn qidirmoq uchun kirish va ro'yxati olish kabi yaxshi kabi
PORTLASH qidirmoq va peptid mos. To'g'ridan-to'g'ri kirishy hisobott retrieval
hisoblanadi asoslangan yoqilgan ketma-ketlik noyob identifikatorlar _ _ ning hammasi asosida ma'lumotlar -
asoslar, shunday kabi PIR, Shveytsariya-PROT, yoki RefSeq. Asosiy va
kengaytirilgan matn qidiruvlari qaytadin protein yozuvlar sanab o'tilgan qisqa bayoni; yakunida
chiziqlar bilan ma'lumotion yoqilgan oqsil identifikatorlar, mos keldi dalalar , himoya qilishichida
ism, taksonomiya, superfamily, domen, va motagar, bilan giper-
matn havolalar uchun the to'la kirish hisobott va uchun oʻzaro bogʻlangan
ma'lumotlar bazalari. Ko'proq dan 50 dalalar _ bor qidirish mumkin, shu jumladanuding haqida
30 ma'lumotlar bazasise noyob identifikatorlar _ _ (masalan, PDB ID, EC raqamr,
PubMed ID, va KEGG yo'ly raqam) va a wide diapazon
ning izohtion matnlar (masalan, oqsil ism, organizm ism,
ketma-ketlik xususiyat, va qog'oz sarlavha). The BLAST q
turkumlash va topshirish savodliu ma `lumot uchun xaritaga tushirilgan tarafdori
paychalar. In PIR-PSD, oqsil xususiyatlari kabi kabi bog'lash saytlar, tuzilmalar
tural motivlar, va post-tarjima modifikatsiyalar _ _ bor teglangan
bilan " eksperimental " holat uchun eksperimental tarzda aniqlashed
Xususiyatlari uchun farqlash dan bular bu bor hisoblashly
bashorat qilingan; Qanaqasigahar doim, ular bor edi emas bo'lgan bog'langan bilan adabiyot -
tur iqtiboslar. A tizimematik qo'llanma atribut ning eksperimental
Xususiyatlari hisoblanadi bo'lish mashinasurildi tashqariga bilan kompyuter yordamida mapping
uchun mavjud oqsil bibliografik ma `lumot. Shunday qilib uzoq, a oz
ming eksperimental features have bo'lgan bog'langan bilan
nashrlar.
PIR-NREF DATABASE
The PIR-NREF beradi a o'z vaqtida va keng qamrovli yig'im-
tion ning oqsil ketma-ketlike ma'lumotlar, saqlash sur'at bilan the genome
ketma-ketlik loyihalar va o'z ichiga oladining manba atribut va
minimal redundancy. The ma'lumotlar bazasi o'z ichiga oladi hammasi ketma-ketlikes ichida
PIR-PSD, Shveytsariya-PROT (3), TrEMBL (3), RefSeq (4),
GenPept, va PDB (5), jami Ko'proq dan 1 000 000 yozuvlar
curijaraga. Bir xil ketma-ketliklar dan the bir xil manba organizm
(turlar) xabar berdi ichida boshqacha ma'lumotlar bazalari bor taqdim etishted kabi a
yagona NREF kirishy bilan oqsil identifikatorlar, qo'shilish raqamlar, va
Har bir asosiy ma'lumotlar bazasidan protein nomlari, w kabiamino kabi
kislota ketma-ketlik, taksonomy, va kompozitsion bibliografik ma'lumotlar.
Shuningdek sanab o'tilgan bor bog'liq ketma-ketliklar aniqlangan _ _ tomonidan yanahamma narsa
FASTQidiruv (6), shu jumladan, har xildan bir xil ketma-ketliklar
organizmlar, bir xil pastki ketma-ketliklar, va juda o'xshash
ketma-ketliklar (  95% identifikatory). NREF mumkin bo'l ishlatilgan uchun ketma-ketlik
qidirish va oqsil identifikatsiya _ _ qarshi the butun
ketma-ketlik yig'ish yoki a pastki to'plam ning bitta yoki Ko'proq genomlar.
The kollektiv oqsil ismlar, shu jumladan sinonimlar, va the
bibliografik ma `lumot mumkin bo'l ishlatilgan uchun rivojlantirish a oqsil
nomi ontologiya. The boshqacha oqsil ismlar tayinlangan tomonidan
boshqacha ma'lumotlar bazasises may Yordam aniqlash izohtion errors, ayniqsa
sially bular natijating dan keng ko'lamli genomik izoh.
MAVJUDLIGI
PIR veb sayt. The PIR web sayt bog‘laydi ma'lumotlar kon va
ketma-ketlik tahlil asbobs uchun asosida ma'lumotlar bazalari uchun ma'lumotma-
tion olishal va bilamanpaypoq kashfiyot, bilan funksionallik
uchun interaktiv so'rovlar, kombinatsiyalar ning ketma-ketlike va izoh-
tion matn qidirish, va sorting va visual kashfiyot ning qidirmoq
natijalar. The uch asosiy ma'lumotlar bazasises (PSD, NREF va iProClass)
primi ifodalaydikirish nuqtalari PIR veb-saytida, hammasi qaysi
provideo matn qidirmoq uchun kirish va ro'yxati olish kabi yaxshi kabi
PORTLASH qidirmoq va peptid mos. To'g'ridan-to'g'ri kirishy hisobott retrieval
hisoblanadi asoslangan yoqilgan ketma-ketlik noyob identifikatorlar _ _ ning hammasi asosida ma'lumotlar -
asoslar, shunday kabi PIR, Shveytsariya-PROT, yoki RefSeq. Asosiy va
kengaytirilgan matn qidiruvlari qaytadin protein yozuvlar sanab o'tilgan qisqa bayoni; yakunida
chiziqlar bilan ma'lumotion yoqilgan oqsil identifikatorlar, mos keldi dalalar , himoya qilishichida
ism, taksonomiya, superfamily, domen, va motagar, bilan giper-
matn havolalar uchun the to'la kirish hisobott va uchun oʻzaro bogʻlangan
ma'lumotlar bazalari. Ko'proq dan 50 dalalar _ bor qidirish mumkin, shu jumladanuding haqida
30 ma'lumotlar bazasise noyob identifikatorlar _ _ (masalan, PDB ID, EC raqamr,
PubMed ID, va KEGG yo'ly raqam) va a wide diapazon
ning izohtion matnlar (masalan, oqsil ism, organizm ism,
ketma-ketlik xususiyat, va qog'oz sarlavha). The BLAST qidirm


Download 456.44 Kb.

Do'stlaringiz bilan baham:
1   ...   5   6   7   8   9   10   11   12   13




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling