Filogenetik daraxtlar klasterlash metodlar mundarija


Filogenetik daraxtlarni o'qishda eng ko'p uchraydigan xatolar


Download 316.7 Kb.
bet8/10
Sana18.06.2023
Hajmi316.7 Kb.
#1588660
1   2   3   4   5   6   7   8   9   10
Bog'liq
Genlarni filogenetik shajaralarini organish mundarija kirish 1

Filogenetik daraxtlarni o'qishda eng ko'p uchraydigan xatolar


Filogenetik shajaralarko'pincha evolyutsion biologiyada (va umumiy biologiyada) keng qo'llaniladigan grafikalar bo'lishiga qaramay, bu oddiy grafika
o'quvchiga etkazish uchun mo'ljallangan xabarni noto'g'ri talqin qiladigan ko'plab talabalar va mutaxassislar mavjud.
Magistral yo'q
Birinchi xato - bu evolyutsiya taraqqiyotni nazarda tutadi deb o'ylab, ularni yonma-yon o'qish. Agar biz evolyutsion jarayonni to'g'ri tushunsak, ajdodlar turini chap tomonda va rivojlangan turlarni o'ng tomonda deb o'ylash uchun hech qanday sabab yo'q.
Daraxtning botanika o'xshashligi juda foydali bo'lsa-da, u endi u qadar aniq bo'lmagan nuqtaga keladi. Daraxtda mavjud bo'lmagan hal qiluvchi daraxt tuzilishi mavjud: magistral. Filogenetik daraxtlarda biz hech qanday asosiy novdalarni uchratmaymiz.
Xususan, ba'zi odamlar insonni evolyutsiyaning yakuniy "maqsadi", shuning uchun tur deb hisoblashlari mumkin. Homo sapiens U har doim yakuniy shaxs sifatida joylashgan bo'lishi kerak.
Biroq, bu nuqtai nazar evolyutsion tamoyillarga mos kelmaydi. Agar biz filogenetik daraxtlarning harakatlanuvchi elementlar ekanligini tushunsak, ularni joylashtirishimiz mumkin Homo daraxtning har qanday terminal holatida, chunki bu xususiyat vakolatxonada ahamiyatli emas.
Tugunlar aylanishi mumkin
Filogenetik shajaralarhaqida bilishimiz kerak bo'lgan muhim xususiyat shundaki, ular statik bo'lmagan grafikalarni aks ettiradi.
Ularda bu filiallarning hammasi aylanib ketishi mumkin - xuddi uyali aloqa moslamasi xuddi shunday. Biz filiallarni xohlagancha siljitishimiz mumkinligini aytishni istamaymiz, chunki ba'zi harakatlar naqshning o'zgarishini yoki topologiya Daraxtdan. Biz aylantira oladigan narsa tugunlardir.
Daraxt xabarini talqin qilish uchun biz shoxlarning uchlariga emas, balki grafaning eng muhim jihati bo'lgan novdalarga e'tibor qaratishimiz kerak.
Politomiya: filogenetik daraxt tugunida ikkitadan ortiq shoxga ega bo'lganda, polotomiya borligi aytiladi. Bunday holatlarda filogenetik daraxt to'liq echilmagan, chunki ular bilan bog'liq bo'lgan organizmlar o'rtasidagi munosabatlar aniq emas.
Bu odatda ma'lumotlarning etishmasligidan kelib chiqadi va faqat tadqiqotchi ko'proq to'planganda tuzatilishi mumkin.

Tashqi guruh: filogenetik mavzularda tashqi guruh tushunchasini eshitish odatiy holdir - deyiladi tashqi guruh. Ushbu guruh daraxtni ildiz otishi uchun tanlangan. U ilgari o'quv guruhidan ajralib chiqqan takson sifatida tanlanishi kerak. Masalan, men echinodermalarni o'rgansam, foydalanishingiz mumkin tashqi guruh dengiz shovqinlari.


Turlari
Daraxtlarning uchta asosiy turi mavjud: kladogrammalar, qo'shimcha daraxtlar va ultrametrik daraxtlar.
Kladogrammalar eng oddiy daraxtlar bo'lib, organizmlarning umumiy nasabga bog'liqligini ko'rsatadi. Ushbu turdagi daraxtlarning ma'lumotlari dallanadigan naqshlarda joylashgan, chunki filiallarning kattaligi qo'shimcha ma'noga ega emas. Ikkinchi turdagi daraxtlar qo'shimchalar bo'lib, ular metrik daraxtlar yoki filogrammalar deb ham ataladi. Filiallarning uzunligi evolyutsion o'zgarish
miqdori bilan bog'liq.
Bundan tashqari, biz daraxtni chizishning bir necha yo'li borligini yodda tutishimiz kerak. Ko'p marta bu kitob yoki jurnal uslubiga bog'liq va filiallarning shakli va holatidagi o'zgarishlar ular bizga etkazmoqchi bo'lgan ma'lumotlarga ta'sir qilmaydi.
Hozirgi ajdodlarimiz yoki "eski" turlarning mavjudligini aniqlay olmaymiz Qachon biz turlarga murojaat qilamiz joriy biz ularga ajdodlar tushunchalarini
qo'llamasligimiz kerak. Masalan, shimpanzeler va odamlar o'rtasidagi munosabatlar haqida o'ylab ko'rganimizda, shimpanzeler bizning nasabimizga ajdodlarimiz deb noto'g'ri tushunchaga ega bo'lishimiz mumkin.
Biroq, shimpanze va odamlarning umumiy ajdodi ham bo'lmagan. Shimpanzeni ajdodlar deb o'ylash, uning evolyutsiyasi ikkala nasl ajratilgandan so'ng to'xtagan deb taxmin qilish edi.
Ushbu fikrlarning xuddi shu mantig'iga amal qilgan holda, filogenetik daraxt bizga yosh turlar ham borligini aytmaydi. Allel chastotalari doimiy ravishda o'zgarib turishi va vaqt o'tishi bilan yangi belgilar o'zgarib turishi sababli, turning yoshini aniqlash qiyin, va, albatta, daraxt bizga bunday ma'lumot bermaydi.
"Allel chastotalarining vaqt o'tishi bilan o'zgarishi" populyatsiya genetikasi evolyutsiyani belgilaydi.
Ular o'zgarmasdir
Filogenetik daraxtga qarab, biz ushbu grafika shunchaki aniq dalillardan kelib chiqqan gipoteza ekanligini tushunishimiz kerak. Ehtimol, agar biz daraxtga qo'shimcha belgilar qo'shsak, u uning topologiyasini o'zgartirishi mumkin.
Ko'rib chiqilayotgan organizmlarning munosabatlarini aniqlash uchun eng yaxshi belgilarni tanlashda olimlarning tajribasi muhim ahamiyatga ega. Bundan tashqari, tadqiqotchilarga daraxtlarni baholash va eng maqbulini tanlashga imkon beradigan juda kuchli statistik vositalar mavjud.
Misollar
Hayotning uchta sohasi: Arxeya, Bakteriyalar va Eukarya
1977 yilda tadqiqotchi Karl Vuz tirik organizmlarni uchta domenga: Arxeya, Bakteriyalar va Eukarya guruhlariga birlashtirishni taklif qildi. Ushbu yangi tasniflash tizimi (ilgari faqat ikkita toifasi bo'lgan, Eukaryota va Prokaryota) ribosomal RNK molekulyar markeriga asoslangan edi.
Bakteriyalar va eukariotlar taniqli organizmlardir. Arxeya ko'pincha bakteriyalar bilan yanglishadi. Biroq, bu ularning uyali tarkibiy qismlarining tuzilishida juda katta farq qiladi.
Shuning uchun, ular bakteriyalar singari mikroskopik organizmlar bo'lishiga qaramay, Arxeya domenining a'zolari eukaryotlar bilan yanada yaqinroqdir, chunki ular yaqin ajdodlarimizga ega.
Primatlarning filogeniyasi
Evolyutsion biologiya doirasida eng munozarali mavzulardan biri inson evolyutsiyasi. Ushbu nazariyaning muxoliflari uchun hozirgi odamni keltirib chiqargan maymun ajdodidan boshlangan evolyutsiya mantiqiy emas.
Asosiy tushuncha - biz hozirgi maymunlardan rivojlanmaganligimizni, aksincha ular bilan umumiy ajdodimizni bo'lishganligimizni anglashdir. Maymunlar va odamlar daraxtida, biz "maymun" deb bilgan narsa haqiqiy monofil guruh emasligi, chunki u odamlarni chetga surib qo'ygan.
Ma‘lumotlarni intelektual tahlilida k-means klasterizatsiya algoritmi eng sodda, eng tushunarli va eng ko‘p ishlatiladigan algoritmlardan biri xisoblanadi. K-means algoritmi berilgan n ta obyektdan iborat toplamni bir biriga o‘xshash obyektlardan iborat k ta guruhga ajratadi. Bu algoritm uchun k-guruhlar soni aniq belgilangan bo‘lishi kerak. Algoritmning asosiy g‘oyasi k ta markazni ushlab olish va obyektlarni shu markazlar atrofiga yig‘ib chiqishdan iborat. Bunda obyektlar k ta markazdan qaysi biriga yaqin bo‘lsa shu guruhga qo‘shib olinadi. K-means algoritmida obyektlar orasidagi masofalarni hisoblash uchun Evklid masofasi, Manhetton masofasi kabilar ishlatiladi. Algoritmni asosiy abzalligi uni ishlash tezligida, k-means boshqa olgaritmlarga qaraganda tezroq ishlaydi. Lekin unga guruh(klaster)lar sonini oldindan ko‘rsatish kerak. Bu k-means algoritmini eng katta kamchiligi hisoblanadi. 3.2 EM(Expectation Maximization). EM algoritmi ham k-means algoritmi kabi iterativ usulda klasterlarga ajratishga mo‘ljallangan. K-means yaxshi natija ko‘rsatadigan barcha to‘plamalar uchun EM ham yaxshi natija ko‘rsata oladi. Bu algoritm statik ma‘lumotlar bazasi uchun mo‘ljallangan. EM obyektlarni bir biriga o‘xshashligini masofa bo‘yicha emas, extimollik orqali hisoblaydi, va bu bazi holatlarda yaxshi natija berishi mumkin. Chiziqli bo‘lmagan xolatlarda k-means guruhlarga ajratishda xatolikka yo‘l qo‘yadi, EM esa bu holatlarda ancha yaxshi natija beradi. EM real ma‘lumotlar uchun boshqa algoritmlarga qaraganda yaxshi natija ko‘rsatadi. Kamchiligi bir biriga yaqin joylashgan obyektlarni klasterlashda ko‘pincha xatolikka yo‘l qo‘yadi, ishlash tezligi boshqa algoritmlarga nisbatan sekinroq.
Berilgan obyektlarni extimollik bo‘yicha qaysi sinfga tegishli ekanligini aniqlab, daraxtga barg sifatida qo‘shib qo‘yadi. Algoritm k-means, EM algoritmlarida uchramaydigan ko‘plab imkoniyatlarga ega. Masalan CobWeb algoritmi dinamik ma‘lumotlarni klasterlashda ham ishlatiladi. Yangi obyektni kiritish va uni qaysi sinfga tegishli ekanligini aniqlash uchun update funksiyasi ishlatiladi, va bu amal log(n) vaqtda bajariladi. Klasterlar sonini avtomatik tarzda aniqlaydi. Bundan tashqari so‘ngi qo‘shilgan obyektlarni o‘chirib tashlash ham mumkin. Bir so‘z bilan aytganda online tarzda klasterlash uchun CobWeb algoritmi juda samarali. Lekin bu algoritm k-means kabi barcha xolatlar uchun yaxshi yechim topa olmaydi, ko‘pincha klasterlarga ajratishda xatoliklarga yo‘q qo‘yadi. Ma‘lumotlarni berilish taribi, klasterlash natijasiga tasir ko‘rsatadi.
Berilgan barg barglari soni uchun mumkin bo'lgan daraxtlar soni ma'lum bir daraxt turiga bog'liq, ammo har doim belgi qo'yilmagan daraxtlarga qaraganda ko'proq etiketlanadi, bifurkatsiya qilishdan ko'ra ko'p qirrali va ildiz otmagan daraxtlarga qaraganda ko'proq ildiz otadi. Oxirgi farq biologik jihatdan eng dolzarbdir; ildiz otmaydigan daraxtda ko'plab joylar bo'lgani uchun paydo bo'ladi. Belgilangan daraxtlarni bifurkatsiya qilish uchun ildiz otilgan daraxtlarning umumiy soni:
barg tugunlari sonini ifodalaydi.[9] Noma'lum sonli ketma-ketliklardan iborat filogenetik shajaralaryordamida quriladi hisoblash filogenetikasi usullari. Kabi masofaviy-matritsali usullar qo'shni qo'shilish yoki UPGMA, hisoblab chiqadigan genetik masofa dan bir nechta ketma-ketlikdagi hizalamalar, amalga oshirish eng sodda, ammo evolyutsion modelga murojaat qilmang. Kabi ko'plab ketma-ketlikni tekislash usullari ClustalW daraxt qurilishining oddiy algoritmlari (ya'ni masofaga qarab) yordamida daraxtlarni yarating. Maksimal parsimonlik filogenetik daraxtlarni baholashning yana bir oddiy usuli, ammo evolyutsiyaning yopiq modelini (ya'ni parsimonlikni) nazarda tutadi. Ning yanada rivojlangan usullari maqbullik mezonlari ning maksimal ehtimollik, ko'pincha a Bayes ramkasiva filogenetik daraxtlarni baholashda evolyutsiyaning aniq modelini qo'llang.[10] Ushbu usullarning ko'pchiligidan foydalangan holda optimal daraxtni
aniqlash Qattiq-qattiq,[10] shunday evristik qidirish
va optimallashtirish ma'lumotlar mos keladigan oqilona daraxtni aniqlash uchun usullar daraxtlarni skorlash funktsiyalari bilan birgalikda qo'llaniladi.
Daraxtlarni qurish usullarini bir necha mezon asosida baholash mumkin:[20]

  • samaradorlik (javobni hisoblash uchun qancha vaqt ketadi, qancha xotira kerak?)

  • quvvat (bu ma'lumotlardan yaxshi foydalanadimi yoki ma'lumot isrof bo'ladimi?)

  • izchillik (agar har safar bir xil model muammosi uchun har xil ma'lumotlar berilgan bo'lsa, u bir xil javobga qayta-qayta yaqinlashadimi?)

  • mustahkamlik (u asosiy model taxminlarini buzish bilan yaxshi kurashadimi?)

  • qalbakilashtirish (foydalanish yaxshi bo'lmaganda, ya'ni taxminlar buzilganda bizni ogohlantiradimi?)

Daraxtlarni qurish texnikasi ham matematiklarning e'tiboriga sazovor bo'ldi. Daraxtlar yordamida ham qurish mumkin
Belgilangan daraxtlarni bifurkatsiya qilish uchun ildiz otilmagan daraxtlarning umumiy soni:
Belgilangan bifurkatsiya daraxtlari orasida, ildizi yo'q daraxtlar soni

barglari bilan ildiz otgan daraxtlar soniga teng barglar.[10]


Ildizlangan daraxtlar soni maslahatlar soniga qarab tez o'sib boradi. 10 ta

maslahat uchun ko'proq mumkin bifurkatsiya daraxtlari va ko'p qirrali daraxtlar soni tezroq o'sib boradi. Ikkinchisining oldingisidan 7 baravar ko'pligi.


Evolyutsion ma'noda, cecaceans boshqa sutemizuvchilar bilan munosabatlari juda aniq bo'lmagan umurtqali hayvonlar guruhini anglatadi. Morfologik jihatdan kitlar, delfinlar va boshqa a'zolar boshqa sutemizuvchilarga deyarli o'xshamaydilar.

Download 316.7 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling