Oqsillarni identifikatsiyalash resursi (Protein Identification Resource,pir) Reja Kirish Asosiy qism. I-bob Oqsillarni identifikatsiyalash resursi
Download 456.44 Kb.
|
Kafedra mudiri: __________________
The Protein Ma `lumot Manba (PIR) hisoblanadi a o'zaro maydalangan ommaviy manba ning oqsil informatika bu qo'llab-quvvatlaydi genomik va proteomik tadqiqot va ilmiy- tifik kashfiyot. PIR saqlaydi the Protein Ketma-ketlik Ma'lumotlar bazasi (PSD), a izohli oqsil ma'lumotlar bazasi qarshi olish ustida 283 000 ketma-ketliklar qoplash the butun taksonomik diapazon. Oila tasniflash hisoblanadi ishlatilgan uchun sezgir identifikatsiya qilish, izchil izohtion, va aniqlash ning izoh xatolar. The super oila kurasiya belgilaydi imzo domen arxitektura va toifalarga ajratadi aʼzolik uchun yaxshilash avtomatlashtirilgan tasniflash. Kimga kattalashtirish; ko'paytirish the miqdori ning tajriba - tal izoh, the PIR ega rivojlangan a bibliografiya tizimi uchun adabiyot qidirish, xaritalash, va foydalanuvchi topshirish, va ega olib borilgan retrospektiv atribu- tion ning iqtiboslar uchun eksperimental Xususiyatlari. PIR shuningdek saqlaydi NREF, a ortiqcha bo'lmagan ma'lumotnoma ma'lumotlar - asos, va iProClass, a integratsiyalashgan ma'lumotlar bazasi ning oqsil oila, funktsiya, va tuzilishi ma'lumotmation. PIR-NREF beradi a o'z vaqtida va tushunishsiv yig'ish ning oqsil ketma-ketliklar, joriytly consichaqish ning Ko'proq dan 1 000 000 yozuvlar dan PIR-PSD, Shveytsariya-PROT, TREMBL, RefSeq, GenPept, va PDB. The PIR veb sayt (http://pir.georgetown.edu) bog‘laydi ma'lumotlar tahlil qilish - opa-singil asboblar uchun asosida maʼlumotlarbases uchun ma `lumot olish va bilim kashfiyot, bilan funktsional- tashkilotlar uchun interaktiv so'roqes, kombinatsiyalar ning ketma-ketlik va text qidirmoqes, va tartiblash va ingl kashfiyot ning qidirmoq natijalar. The FTP sayt provideolar ozod yuklab oling uchun PSD va NREF biweekly relizlar va yordamchi ma'lumotlar bazalari va fayllar. KIRISH In buyurtma uchun ta'minlash integratsiyalashgan va Qo'shilgan qiymat oqsil ma `lumot uchun the ilmiy jamiyat, the Protein Ma `lumot Manba (PIR) davom etadi uchun oshirish uning uch mayor ma'lumotlar bazalari, the Proteyn Ketma-ketce Ma'lumotlar bazasi (PSD), the Ortiqcha bo'lmagan REFerens (NREF) ketma-ketlik ma'lumotlar bazasise, va the integratsiyalashd Proteyn Tasniflash (iProClass) ma'lumotlar bazasi (1). Quyidagi bo'limlar kalitni tavsiflaydi o'tgan yildagi o'zgarishlar. PIR-PSD The PIR-PSD hisoblanadi ommaviy domen oqsil ketma-ketlike ma'lumotlar bazasi, qaysi curijarada oʻz ichiga oladi283 000 ta izohli va tasniflangan yozuvlar, cojuda yaxshi the butun taksonomik diapazon. Yaqinda rivojlantirish- ment va izohtion sa'y-harakatlar bor qaratilgan yoqilgan superfamily tasniflash va kurasiya va bibliografiya xaritalash va atribut. Superoila tasniflash va curation. A noyob xarakter- istik ning the PIR-PSD hisoblanadi the superfamily tasniflash (2) bu provideolar keng qamrovli, non-otakrorlash, va ierarxik klasterlash ning ketma-ketliklar uchun aks ettirmoq ularning evolyutsion munosabat - kemalar. To mo'ynau erda improve the sifat ning avtomatlashtirilgan tasnifi- tion, biz bor olib borilgan tizimli super oila kurasiya bu: (i) defines the imzo domen arxitektura (raqam, buyurtma, va turlari ning domains) xaraktertayoq ning the superfamily, (ii) toifalarga ajratadi muntazam va sherik members uchun farqlash ketma-ketlik yozuvlar almashish the belgisitur Xususiyatlari dan chetlab o'tishlar (shunday kabi parchalar), va (iii) dizaynNates reprsezgir va urug' a'zolari orasida muntazam members. Bir nechta mingva superoilalar bor bo'lgan qo'lda kurated. The urug' a'zolari provideo a asos uchun avtomatik joylashtirish ning yangi ketma-ketlikes ichiga mavjud superoilalar va uchun avtomatlashtirishc avlodi mulmaslahat ketma-ketlik hizalamalar va filogenetik daraxtlar. Curijaraga, over 99% ning PSD ketma-ketliklar bor tasniflangan ichiga oilalar ning yaqindan bog'liq ketma-ketliklar (da kamida 45% bir xil), va over uchdan ikkisi ning ketma-ketlikes bor sinfberilgan ichiga > 36 000 superfamiyolg'on. Bibliography mapping va atribut. To yaxshilash the sifatli ity ning oqsil izoh tomonidan ortib boradi the miqdori ning tajriba aqliy tasdiqlangan ma'lumotlar bilan manba atribut, the PIR ega rivojlangan a bibliografiya ma'lumotmation tizimi va olib borilgan retrospektiv atribut ning adabiyot ma'lumotlar. The bibliografiya tizimi imkon beradi varaqlash va qidirmoqing ning kengaytirilganve adabiyot PubMed va boshqa kuratlardan barcha protein yozuvlari uchun to'planganed molekulyar ma'lumotlar bazasises, bilan birga interfeys olimlar uchun uchun *To whom yozishmalar kerak bo'l murojaat qilgan. Tel: þ 1 2026872121; Fbolta: þ 1 2026871662; Email: pirmail@georgetown.edu # 2003 yil Oksford University bosing Nuklein Kislotalar Tadqiqot, 2003 yil, Vol. 31, Yo'q. 1 345–347 DOI: 10.1093/nar/gkg040 The Protein Ma `lumot Manba (PIR) hisoblanadi a o'zaro maydalangan ommaviy manba ning oqsil informatika bu qo'llab-quvvatlaydi genomik va proteomik tadqiqot va ilmiy- tifik kashfiyot. PIR saqlaydi the Protein Ketma-ketlik Ma'lumotlar bazasi (PSD), a izohli oqsil ma'lumotlar bazasi qarshi olish ustida 283 000 ketma-ketliklar qoplash the butun taksonomik diapazon. Oila tasniflash hisoblanadi ishlatilgan uchun sezgir identifikatsiya qilish, izchil izohtion, va aniqlash ning izoh xatolar. The super oila kurasiya belgilaydi imzo domen arxitektura va toifalarga ajratadi aʼzolik uchun yaxshilash avtomatlashtirilgan tasniflash. Kimga kattalashtirish; ko'paytirish the miqdori ning tajriba - tal izoh, the PIR ega rivojlangan a bibliografiya tizimi uchun adabiyot qidirish, xaritalash, va foydalanuvchi topshirish, va ega olib borilgan retrospektiv atribu- tion ning iqtiboslar uchun eksperimental Xususiyatlari. PIR shuningdek saqlaydi NREF, a ortiqcha bo'lmagan ma'lumotnoma ma'lumotlar - asos, va iProClass, a integratsiyalashgan ma'lumotlar bazasi ning oqsil oila, funktsiya, va tuzilishi ma'lumotmation. PIR-NREF beradi a o'z vaqtida va tushunishsiv yig'ish ning oqsil ketma-ketliklar, joriytly consichaqish ning Ko'proq dan 1 000 000 yozuvlar dan PIR-PSD, Shveytsariya-PROT, TREMBL, RefSeq, GenPept, va PDB. The PIR veb sayt (http://pir.georgetown.edu) bog‘laydi ma'lumotlar tahlil qilish - opa-singil asboblar uchun asosida maʼlumotlarbases uchun ma `lumot olish va bilim kashfiyot, bilan funktsional- tashkilotlar uchun interaktiv so'roqes, kombinatsiyalar ning ketma-ketlik va text qidirmoqes, va tartiblash va ingl kashfiyot ning qidirmoq natijalar. The FTP sayt provideolar ozod yuklab oling uchun PSD va NREF biweekly relizlar va yordamchi ma'lumotlar bazalari va fayllar. KIRISH In buyurtma uchun ta'minlash integratsiyalashgan va Qo'shilgan qiymat oqsil ma `lumot uchun the ilmiy jamiyat, the Protein Ma `lumot Manba (PIR) davom etadi uchun oshirish uning uch mayor ma'lumotlar bazalari, the Proteyn Ketma-ketce Ma'lumotlar bazasi (PSD), the Ortiqcha bo'lmagan REFerens (NREF) ketma-ketlik ma'lumotlar bazasise, va the integratsiyalashd Proteyn Tasniflash (iProClass) ma'lumotlar bazasi (1). Quyidagi bo'limlar kalitni tavsiflaydi o'tgan yildagi o'zgarishlar. PIR-PSD The PIR-PSD hisoblanadi ommaviy domen oqsil ketma-ketlike ma'lumotlar bazasi, qaysi curijarada oʻz ichiga oladi283 000 ta izohli va tasniflangan yozuvlar, cojuda yaxshi the butun taksonomik diapazon. Yaqinda rivojlantirish- ment va izohtion sa'y-harakatlar bor qaratilgan yoqilgan superfamily tasniflash va kurasiya va bibliografiya xaritalash va atribut. Superoila tasniflash va curation. A noyob xarakter- istik ning the PIR-PSD hisoblanadi the superfamily tasniflash (2) bu provideolar keng qamrovli, non-otakrorlash, va ierarxik klasterlash ning ketma-ketliklar uchun aks ettirmoq ularning evolyutsion munosabat - kemalar. To mo'ynau erda improve the sifat ning avtomatlashtirilgan tasnifi- tion, biz bor olib borilgan tizimli super oila kurasiya bu: (i) defines the imzo domen arxitektura (raqam, buyurtma, va turlari ning domains) xaraktertayoq ning the superfamily, (ii) toifalarga ajratadi muntazam va sherik members uchun farqlash ketma-ketlik yozuvlar almashish the belgisitur Xususiyatlari dan chetlab o'tishlar (shunday kabi parchalar), va (iii) dizaynNates reprsezgir va urug' a'zolari orasida muntazam members. Bir nechta mingva superoilalar bor bo'lgan qo'lda kurated. The urug' a'zolari provideo a asos uchun avtomatik joylashtirish ning yangi ketma-ketlikes ichiga mavjud superoilalar va uchun avtomatlashtirishc avlodi mulmaslahat ketma-ketlik hizalamalar va filogenetik daraxtlar. Curijaraga, over 99% ning PSD ketma-ketliklar bor tasniflangan ichiga oilalar ning yaqindan bog'liq ketma-ketliklar (da kamida 45% bir xil), va over uchdan ikkisi ning ketma-ketlikes bor sinfberilgan ichiga > 36 000 superfamiyolg'on. Bibliography mapping va atribut. To yaxshilash the sifatli ity ning oqsil izoh tomonidan ortib boradi the miqdori ning tajriba aqliy tasdiqlangan ma'lumotlar bilan manba atribut, the PIR ega rivojlangan a bibliografiya ma'lumotmation tizimi va olib borilgan retrospektiv atribut ning adabiyot ma'lumotlar. The bibliografiya tizimi imkon beradi varaqlash va qidirmoqing ning kengaytirilganve adabiyot PubMed va boshqa kuratlardan barcha protein yozuvlari uchun to'planganed molekulyar ma'lumotlar bazasises, bilan birga interfeys olimlar uchun uchun *To whom yozishmalar kerak bo'l murojaat qilgan. Tel: þ 1 2026872121; Fbolta: þ 1 2026871662; Email: pirmail@georgetown.edu # 2003 yil Oksford University bosing Nuklein Kislotalar Tadqiqot, 2003 yil, Vol. 31, Yo'q. 1 345–347 DOI: 10.1093/nar/gkg040 turkumlash va topshirish savodliu ma `lumot uchun xaritaga tushirilgan tarafdori paychalar. In PIR-PSD, oqsil xususiyatlari kabi kabi bog'lash saytlar, tuzilmalar tural motivlar, va post-tarjima modifikatsiyalar _ _ bor teglangan bilan " eksperimental " holat uchun eksperimental tarzda aniqlashed Xususiyatlari uchun farqlash dan bular bu bor hisoblashly bashorat qilingan; Qanaqasigahar doim, ular bor edi emas bo'lgan bog'langan bilan adabiyot - tur iqtiboslar. A tizimematik qo'llanma atribut ning eksperimental Xususiyatlari hisoblanadi bo'lish mashinasurildi tashqariga bilan kompyuter yordamida mapping uchun mavjud oqsil bibliografik ma `lumot. Shunday qilib uzoq, a oz ming eksperimental features have bo'lgan bog'langan bilan nashrlar. PIR-NREF DATABASE The PIR-NREF beradi a o'z vaqtida va keng qamrovli yig'im- tion ning oqsil ketma-ketlike ma'lumotlar, saqlash sur'at bilan the genome ketma-ketlik loyihalar va o'z ichiga oladining manba atribut va minimal redundancy. The ma'lumotlar bazasi o'z ichiga oladi hammasi ketma-ketlikes ichida PIR-PSD, Shveytsariya-PROT (3), TrEMBL (3), RefSeq (4), GenPept, va PDB (5), jami Ko'proq dan 1 000 000 yozuvlar curijaraga. Bir xil ketma-ketliklar dan the bir xil manba organizm (turlar) xabar berdi ichida boshqacha ma'lumotlar bazalari bor taqdim etishted kabi a yagona NREF kirishy bilan oqsil identifikatorlar, qo'shilish raqamlar, va Har bir asosiy ma'lumotlar bazasidan protein nomlari, w kabiamino kabi kislota ketma-ketlik, taksonomy, va kompozitsion bibliografik ma'lumotlar. Shuningdek sanab o'tilgan bor bog'liq ketma-ketliklar aniqlangan _ _ tomonidan yanahamma narsa FASTQidiruv (6), shu jumladan, har xildan bir xil ketma-ketliklar organizmlar, bir xil pastki ketma-ketliklar, va juda o'xshash ketma-ketliklar ( 95% identifikatory). NREF mumkin bo'l ishlatilgan uchun ketma-ketlik qidirish va oqsil identifikatsiya _ _ qarshi the butun ketma-ketlik yig'ish yoki a pastki to'plam ning bitta yoki Ko'proq genomlar. The kollektiv oqsil ismlar, shu jumladan sinonimlar, va the bibliografik ma `lumot mumkin bo'l ishlatilgan uchun rivojlantirish a oqsil nomi ontologiya. The boshqacha oqsil ismlar tayinlangan tomonidan boshqacha ma'lumotlar bazasises may Yordam aniqlash izohtion errors, ayniqsa sially bular natijating dan keng ko'lamli genomik izoh. MAVJUDLIGI PIR veb sayt. The PIR web sayt bog‘laydi ma'lumotlar kon va ketma-ketlik tahlil asbobs uchun asosida ma'lumotlar bazalari uchun ma'lumotma- tion olishal va bilamanpaypoq kashfiyot, bilan funksionallik uchun interaktiv so'rovlar, kombinatsiyalar ning ketma-ketlike va izoh- tion matn qidirish, va sorting va visual kashfiyot ning qidirmoq natijalar. The uch asosiy ma'lumotlar bazasises (PSD, NREF va iProClass) primi ifodalaydikirish nuqtalari PIR veb-saytida, hammasi qaysi provideo matn qidirmoq uchun kirish va ro'yxati olish kabi yaxshi kabi PORTLASH qidirmoq va peptid mos. To'g'ridan-to'g'ri kirishy hisobott retrieval hisoblanadi asoslangan yoqilgan ketma-ketlik noyob identifikatorlar _ _ ning hammasi asosida ma'lumotlar - asoslar, shunday kabi PIR, Shveytsariya-PROT, yoki RefSeq. Asosiy va kengaytirilgan matn qidiruvlari qaytadin protein yozuvlar sanab o'tilgan qisqa bayoni; yakunida chiziqlar bilan ma'lumotion yoqilgan oqsil identifikatorlar, mos keldi dalalar , himoya qilishichida ism, taksonomiya, superfamily, domen, va motagar, bilan giper- matn havolalar uchun the to'la kirish hisobott va uchun oʻzaro bogʻlangan ma'lumotlar bazalari. Ko'proq dan 50 dalalar _ bor qidirish mumkin, shu jumladanuding haqida 30 ma'lumotlar bazasise noyob identifikatorlar _ _ (masalan, PDB ID, EC raqamr, PubMed ID, va KEGG yo'ly raqam) va a wide diapazon ning izohtion matnlar (masalan, oqsil ism, organizm ism, ketma-ketlik xususiyat, va qog'oz sarlavha). The BLAST q turkumlash va topshirish savodliu ma `lumot uchun xaritaga tushirilgan tarafdori paychalar. In PIR-PSD, oqsil xususiyatlari kabi kabi bog'lash saytlar, tuzilmalar tural motivlar, va post-tarjima modifikatsiyalar _ _ bor teglangan bilan " eksperimental " holat uchun eksperimental tarzda aniqlashed Xususiyatlari uchun farqlash dan bular bu bor hisoblashly bashorat qilingan; Qanaqasigahar doim, ular bor edi emas bo'lgan bog'langan bilan adabiyot - tur iqtiboslar. A tizimematik qo'llanma atribut ning eksperimental Xususiyatlari hisoblanadi bo'lish mashinasurildi tashqariga bilan kompyuter yordamida mapping uchun mavjud oqsil bibliografik ma `lumot. Shunday qilib uzoq, a oz ming eksperimental features have bo'lgan bog'langan bilan nashrlar. PIR-NREF DATABASE The PIR-NREF beradi a o'z vaqtida va keng qamrovli yig'im- tion ning oqsil ketma-ketlike ma'lumotlar, saqlash sur'at bilan the genome ketma-ketlik loyihalar va o'z ichiga oladining manba atribut va minimal redundancy. The ma'lumotlar bazasi o'z ichiga oladi hammasi ketma-ketlikes ichida PIR-PSD, Shveytsariya-PROT (3), TrEMBL (3), RefSeq (4), GenPept, va PDB (5), jami Ko'proq dan 1 000 000 yozuvlar curijaraga. Bir xil ketma-ketliklar dan the bir xil manba organizm (turlar) xabar berdi ichida boshqacha ma'lumotlar bazalari bor taqdim etishted kabi a yagona NREF kirishy bilan oqsil identifikatorlar, qo'shilish raqamlar, va Har bir asosiy ma'lumotlar bazasidan protein nomlari, w kabiamino kabi kislota ketma-ketlik, taksonomy, va kompozitsion bibliografik ma'lumotlar. Shuningdek sanab o'tilgan bor bog'liq ketma-ketliklar aniqlangan _ _ tomonidan yanahamma narsa FASTQidiruv (6), shu jumladan, har xildan bir xil ketma-ketliklar organizmlar, bir xil pastki ketma-ketliklar, va juda o'xshash ketma-ketliklar ( 95% identifikatory). NREF mumkin bo'l ishlatilgan uchun ketma-ketlik qidirish va oqsil identifikatsiya _ _ qarshi the butun ketma-ketlik yig'ish yoki a pastki to'plam ning bitta yoki Ko'proq genomlar. The kollektiv oqsil ismlar, shu jumladan sinonimlar, va the bibliografik ma `lumot mumkin bo'l ishlatilgan uchun rivojlantirish a oqsil nomi ontologiya. The boshqacha oqsil ismlar tayinlangan tomonidan boshqacha ma'lumotlar bazasises may Yordam aniqlash izohtion errors, ayniqsa sially bular natijating dan keng ko'lamli genomik izoh. MAVJUDLIGI PIR veb sayt. The PIR web sayt bog‘laydi ma'lumotlar kon va ketma-ketlik tahlil asbobs uchun asosida ma'lumotlar bazalari uchun ma'lumotma- tion olishal va bilamanpaypoq kashfiyot, bilan funksionallik uchun interaktiv so'rovlar, kombinatsiyalar ning ketma-ketlike va izoh- tion matn qidirish, va sorting va visual kashfiyot ning qidirmoq natijalar. The uch asosiy ma'lumotlar bazasises (PSD, NREF va iProClass) primi ifodalaydikirish nuqtalari PIR veb-saytida, hammasi qaysi provideo matn qidirmoq uchun kirish va ro'yxati olish kabi yaxshi kabi PORTLASH qidirmoq va peptid mos. To'g'ridan-to'g'ri kirishy hisobott retrieval hisoblanadi asoslangan yoqilgan ketma-ketlik noyob identifikatorlar _ _ ning hammasi asosida ma'lumotlar - asoslar, shunday kabi PIR, Shveytsariya-PROT, yoki RefSeq. Asosiy va kengaytirilgan matn qidiruvlari qaytadin protein yozuvlar sanab o'tilgan qisqa bayoni; yakunida chiziqlar bilan ma'lumotion yoqilgan oqsil identifikatorlar, mos keldi dalalar , himoya qilishichida ism, taksonomiya, superfamily, domen, va motagar, bilan giper- matn havolalar uchun the to'la kirish hisobott va uchun oʻzaro bogʻlangan ma'lumotlar bazalari. Ko'proq dan 50 dalalar _ bor qidirish mumkin, shu jumladanuding haqida 30 ma'lumotlar bazasise noyob identifikatorlar _ _ (masalan, PDB ID, EC raqamr, PubMed ID, va KEGG yo'ly raqam) va a wide diapazon ning izohtion matnlar (masalan, oqsil ism, organizm ism, ketma-ketlik xususiyat, va qog'oz sarlavha). The BLAST qidirm Download 456.44 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling