I bob drosophila melanogaster genomidagi mutasion kontekstlar taxlil


Download 324.83 Kb.
bet8/11
Sana19.06.2023
Hajmi324.83 Kb.
#1621213
1   2   3   4   5   6   7   8   9   10   11
Bog'liq
drosophila melanogaster genomidagi mutatsion kontekstlar tahlili

TABLE 2 3-nashrdagi izohlar





Euchromatin

12 Mb of

Descriptiona

116.8 Mb

heterochromatin

Protein-coding genes

13,379

297

tRNA genes

290

0

microRNA genes

23

ND

snRNA genes

28

ND

snoRNA genes

28

ND

Pseudogenes

17

ND

Misc. noncoding RNA

38

2

rRNA genes



6

Transposons

1,572

ND

Total protein-coding genes

13,379

297

Total length of euchromatin/heterochromatin

116.8 Mb

12 Mb

Exons

60,897

1109

Protein-coding exonsb

54,934

999

Length of genome in exons

27.8 Mb (24%)

382 kb (3%)

Introns

48,257

803

Genes with 5′ UTR

10,227 (76%)

152 (51%)

Transcripts with 5′ UTR

14,707 (81%)

215 (57%)

Average 5′ UTR length

265 nucleotides

217 nt

Genes with 3′ UTR

9,646 (72%)

119 (40%)

Transcripts with 3′ UTR

14,012 (77%)

172 (46%)

Average 3′ UTR length

442 nucleotides

311 nt

Average ratio of length of CDS/transcriptc

0.75

0.79

Total protein-coding transcripts

18,106

379

Genes with alternative transcripts

2,729 (20%)

49 (16%)

Average number of transcripts per alternatively

2.75

2.8

 spliced gene



Total number alternative transcripts

4,743

88

Unique peptides

15,848

351

Gene-prediction data only

815

89

BLASTX/TBLASTX homologies

10,996

167

ESTs and DGC cDNA sequencing reads

10,406

134

GenBank accessions

3,104

22

ARGS (RefSeq)

795

0

Error report submissions

825

7

Full-insert DGC cDNAs

9,297

58

Qisqartmalar: UTR, tarjima qilinmagan hudud; CDS, (oqsil)-kodlash ketma-ketligi; R2, 2-nashr; R3, nashr 3; SH, aniqlanmagan. Barcha statistika faqat protein kodlovchi genlar uchun. Raqamlar 2002 yil 25 noyabrdagi FlyBase annotatsiya ma'lumotlar bazasini aks ettiradi.


b CDS o'z ichiga olgan har qanday ekson, hatto eksonning aksariyati UTR bo'lsa ham.
c Kodlash mintaqasining uzunligi butun protein kodlash transkriptining uzunligiga bo'linadi, barcha protein kodlash transkriptlari bo'yicha o'rtacha hisoblanadi.

Release 1 ketma-ketligi va izohlarini nashr etgandan so'ng, ikkita guruh tahlillarni nashr etdi, bu esa xabar qilingan genlar soni sezilarli darajada kam baholanganligini ko'rsatdi. Andrews va boshqalar. 3000 testisdan olingan EST ketma-ketligini tahlil qildi (2). Ikki yuztasi BLAST yordamida boshqa ESTlarga yoki 1 ta izohni chiqarishga moslasha olmadi. Andrews va boshqalar. Ular yangi genlarni yoki hech bo'lmaganda izohsiz ekzonlarni ifodalaydi, deb taxmin qilishdi. Biroq, Release 3 annotatsiyasi faqat moyakga xos ESTlar tomonidan qo'llab-quvvatlanadigan faqat 38 ta genni o'z ichiga oladi; ulardan faqat oltitasi ilgari izohsiz edi. Shuning uchun, ehtimol, Endryu va boshqalar. Annotatsiya qilinmagan ekzonlarni, xususan, butun genlarni emas, balki 5 ′ UTR eksonlarini aniqladi.

Gopal va boshqalar. Genscan dasturidan foydalanib, boshqa dalillardan qat'i nazar, ishonchli genlarni aniqlaydigan hisoblash tahlilini o'tkazdi va keyin ularni ushbu genlarning mavjudligini qo'llab-quvvatlaydigan protein motivlarini aniqlash uchun tarjima qildi (56). Ular Release 2 izohiga kiritilmagan 1042 ta yangi gen haqida xabar berishdi. Euchromatin bilan bog'langan 781 gen Release 3 izohlari bilan taqqoslandi. Ularning aksariyati endi 3-versiyadagi izohlar bilan ifodalanadi; ammo qolgan 261 ta gen uchun tegishli izohlar mavjud emas va ba'zilari 3-reliz annotatsiyasida o'tkazib yuborilgan haqiqiy genlar bo'lishi mumkin.




  1. BOB.BIR-BIRIGA MOS KELADIGAN GEN TUZILMALARI.

2.1.Evromatik genomning reannotatsiyasining kutilmagan topilmalari


Evromatik genomning reannotatsiyasining kutilmagan topilmalaridan biri g'ayrioddiy bir-biriga o'xshash gen tuzilmalari soni edi. 3-rasmda ba'zi misollar ko'rsatilgan.



2-rasm
Shakl Murakkab gen tuzilmalari. (A) Bir-birining ustiga chiqadigan genlar. CG9455 ning 3' uchi Serin proteaza inhibitori 1 (Spn1: CG9456) ning 5' uchiga to'g'ri keladi va 408 ta asosiy ketma-ketlikni taqsimlaydi. Spn1 ning tarjimani boshlash joyi CG9455 translatsiya to'xtash joyidan 219 bp ni tashkil qiladi, shuning uchun genlar alohida oqsillarni kodlaydi. CG9455 ifodasi embrionlarda aniqlanmaydi va gendan cDNKlar moyak kutubxonasidan olingan, bu gen kattalar uchun xos bo'lishi mumkinligini ko'rsatadi. Spn1 embrionlarda ko'z primordiumida ifodalanadi. Ularning bir-biriga mos kelmaydigan ifoda shakllari genlarning transkripsiyasi mustaqil ekanligini ko'rsatadi. (B) Ichki genlar. Ushbu misolda ikkita gen, CG31049 va CG33204, mos ravishda o'rikning Darkener (Doa) genining ikkinchi va uchinchi intronlariga mos keladi. Doa - karboksi uchini bo'lishuvchi, ammo aniq aminokislotalarga ega bo'lgan oqsillarni kodlash qobiliyatiga ega bo'lgan to'rtta alohida 5 'eksonli muqobil ravishda birlashtirilgan genga misol. (C) Interleaved genlar bir xil genomik mintaqadan qarama-qarshi zanjirlarda transkripsiyalanadi. Ularning ekzonlari bir-birining ustiga chiqmaydi, balki to'ldiruvchi zanjirdagi genning introni bilan bog'lanadi. Ushbu misolda, CG5500 ning oxirgi ikki eksoni qo'pol birinchi intronga (ro: CG6348) va ro'ning oxirgi ikki eksoni CG5500 ning birinchi introniga mos keladi. D) Disistronik genlar. CG31188 dicistronic genning namunasidir. Bitta to'liq uzunlikdagi cDNK ikkita ochiq o'qish ramkasini (ORFs) o'z ichiga oladi, ORF1 va ORF2, ramka ichidagi to'xtash kodonlari bilan ajratilgan. ORF1 inson, kalamush va qurtlarda bashorat qilingan genlarga o'xshaydi. ORF2 prolil-4-gidroksilazalarga ketma-ketlik o'xshashligini taqsimlaydi. (E) Muqobil ravishda birlashtirilgan genlar.

Download 324.83 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   11




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling