Alimov Shohruhning "Bioinformatika va biomexanika"


Bioma’lumotlarni qayta ishlash va model qurish


Download 175.42 Kb.
bet3/3
Sana23.03.2023
Hajmi175.42 Kb.
#1287986
1   2   3
Bog'liq
Bio lab 1

Bioma’lumotlarni qayta ishlash va model qurish
Besh yoshgacha bo'lgan bolalar o'limi bolalar salomatligi holatini o'lchash uchun eng keng tarqalgan ko'rsatkichdir. Shuningdek, u har qanday davlatning umumiy rivojlanishining ko'rsatkichidir. Besh yoshgacha bo'lgan bolalar o'limi - bu bolalarning besh yoshga to'lgunga qadar o'lish ehtimoli. Butun dunyo bo'ylab besh yoshgacha bo'lgan bolalar o'limi ko'rsatkichlari Janubiy Osiyo va Sahroi Kabirdagi Afrika mamlakatlarida yuqori. Hindistonda besh yoshgacha bo‘lgan bolalar o‘limi darajasi 2000 yilda 1000 tirik tug‘ilgan chaqaloqqa 83 ta o‘limdan 2017 yilda 42 taga kamaydi [1]. Shtat miqyosidagi hisobotlarga ko'ra, besh yoshgacha bo'lgan bolalar o'limi Uttar-Pradeshda eng yuqori, 1-rasmda ko'rsatilganidek, Madxya-Pradesh va Chhattisgarx [2] dan keyin. Hindiston kabi rivojlanayotgan mamlakatlarda bolalar salomatligi uchun asosiy muammo bo'lib qolmoqda. Bolalar o'limini tushuntirishning muhim omillarini tushunish o'lim darajasini pasaytirishning ajralmas qismidir, ammo bu etarli emas.Hozirgi kunda Mashinalarni o'rganish (ML) texnikasi sog'liqni saqlash sohasidagi tadqiqotlarda keng qo'llaniladi. Turli xil sog'liqni saqlash va biotibbiyot ma'lumotlarini bashorat qilish va tasniflash uchun turli xil mashina o'rganish modellari ishlatilgan. Ushbu ML modellari o'zaro ta'sirlarni avtomatik ravishda aniqlashi va maqsadli o'zgaruvchi va mustaqil o'zgaruvchilar o'rtasidagi chiziqli bo'lmagan munosabatni topishi mumkin. Mashinani o'rganish yondashuvlaridan qiziqishning sog'liq natijalari bilan bog'liq ta'sirlarni va bu ta'sirlar o'rtasidagi potentsial o'zaro ta'sirlarni aniqlash uchun foydalanish mumkin [3]. Sog'liqni saqlash ma'lumotlarini aniq baholash uchun regressiya, logistik regressiya, asosiy komponentlar tahlili (PCA), qarorlar daraxtlari va maksimal ehtimollik usullari kabi turli xil mashinani o'rganishni bashorat qilish va tasniflash modellari ishlatilgan. Ushbu yondashuvlar besh yoshgacha bo'lgan bolalar o'limining muhim omillarini erta bashorat qilish va tushunishga yordam beradi. Efiopiya tomonidan olib borilgan tadqiqot bolalar o'limi sabablarini topish uchun J48 mashina o'rganish va sun'iy neyron tarmog'i (ANN) texnikasi haqida dalillarni taqdim etadi [4]. Boshqa bir tadqiqot shuni ko'rsatdiki, mashinani o'rganish modeli Efiopiya ma'muriy zonalarida besh yoshgacha bo'lgan bolalarning kam ovqatlanish holatini samarali ravishda bashorat qilgan [5]. Tadqiqotlar neonatal o'lim va morbidlik xavfini bashorat qilish uchun mashinani o'rganish texnikasining samaradorligini baholadi [6, 7]. Tadqiqotda besh yoshgacha bo'lgan bolalarning ovqatlanish holatini bashorat qilish uchun iterativ dichotomizer3 (ID3), tasodifiy o'rmon va qaror daraxti modellaridan foydalanilgan [8]. Boshqa bir hind tadqiqoti mashinani o'rganish usullaridan foydalangan holda ozuqa moddalarining inson salomatligiga ta'sirini bashorat qildi [9]. Hozirgacha adabiyotlarni qidirishimizda besh yoshgacha bo'lgan bolalar o'limini bashorat qilish uchun mashinani o'rganish modeli texnikasidan foydalangan holda nashr etilgan tadqiqot mavjud emas. Bundan tashqari, o'tgan tadqiqotlarda mashinani o'rganish usullaridan foydalangan holda bolalar o'limini aniq baholash uchun umumiy bashorat qilish tizimi yo'qligi aniqlandi.Yuqori aniq natijalarni ta'minlash va sog'liqni saqlash tadqiqotchilariga turli jihatlar to'plami bilan tajriba o'tkazish imkonini beradigan aniq bashorat va tasniflash modellariga ehtiyoj bor. Ushbu tadqiqot mashinani o'rganish modellarining aniqligi yoki samaradorligini baholash va besh yoshgacha bo'lgan bolalar o'limini o'rganishda ma'lumot olish usuli yordamida muhim omillarni topish imkonini beradi.

Metodologiya


Ushbu tadqiqot usullari besh yoshgacha bo'lgan bolalar o'limini bashorat qilish uchun asos orqali bosqichma-bosqich tushuntirilgan. Ushbu tadqiqot ma'lumotlarini tahlil qilish turli bosqichlarda amalga oshirildi. Birinchidan, muhim omillarni (p < 0,05) topish uchun ko'p o'zgaruvchan logistik regressiya tahlili o'tkazildi, so'ngra ma'lumotlar to'plamiga mashinani o'rganish modelining yondashuvlari qo'llanildi. Mashinani o'rganish tizimlarining tushuntirishlari 2-rasmda tasvirlangan. Ma'lumotlarning barcha tahlillari Python 3.3, STATA 16.0 va SPSS-27 dasturlari yordamida o'tkazildi.

Ma'lumotlarni oldindan qayta ishlash
Yakuniy ma'lumotlar to'plamini yaratgandan so'ng, keyingi qadam turli usullardan foydalangan holda ma'lumotlarni oldindan qayta ishlash edi. Ushbu bosqichda takroriy va etishmayotgan o'zgaruvchilar taxminiy o'rtacha moslik usuli yordamida olib tashlandi. Shundan so'ng, barcha qator va toifali o'zgaruvchilar raqamli qiymatlarga aylantirildi.

Ma'lumotlarni oldindan qayta ishlashda muhim nuqta - maqsad yoki natija o'zgaruvchisini muvozanatlash zarurati. Ma'lumotlar to'plamida besh yoshgacha bo'lgan bolalar o'limi soni tirik bolalar bilan solishtirganda (38 921 tirik bolalar va besh yoshgacha bo'lgan 2830 o'lim) nisbatan juda egri edi. Maqsadni (qaram) muvozanatlash uchun tasodifiy ortiqcha tanlab olish usuli qo'llanildi, shundan so'ng 93:7 ga nisbatan 50:50 nisbati olindi.


Xususiyatlarni tanlash


Xususiyatlarni tanlash g'oyasi ma'lumotlar to'plamidagi asosiy xavf omillarini ularning ahamiyatiga qarab tartiblashdir. Bu tanlangan o'zgaruvchilarning har biri uchun ma'lumot olish qiymatlarini hisoblashga asoslanadi. Ushbu tadqiqotda biz bolalar o'limiga katta hissa qo'shadigan xavf omillarini yoki muhim xususiyatlarni topish uchun tasodifiy o'rmon modelidan foydalandik. Yuqori ma'lumot olish qiymatlari bizga o'zgaruvchilar sinfi bilan yuqori darajada bog'liq bo'lgan muhim o'zgaruvchilarni bildiradi. Biz tasodifiy ravishda eng yaxshi sakkizta ma'lumot qiymatlarini tanladik, biz keyinchalik model qurishda foydalandik.
Model qurish
Ma'lumotlarni bo'lish
Ushbu bosqichda biz ma'lumotlar to'plamini o'qitilgan va sinovdan o'tgan ma'lumotlarga ajratamiz. O'qitilgan ma'lumotlarning 70% modelni tasniflash uchun va 30% modelni baholash uchun ishlatiladi. Shunga qaramay, biz tasniflash modeli haqida aniq tasavvurga ega bo'lish uchun ma'lumotlar to'plamini o'qitilgan va sinovdan o'tgan (80% va 20% mos ravishda) qismlarga ajratamiz. Yaxshiroq bashoratli modellarni yaratish uchun barcha mustaqil xususiyatlar bir martalik kodlashda o'zgartirilishi kerak edi. Ushbu tadqiqotda qaram o'zgaruvchi ikkilik, ya'ni o'lik / tirik edi. Keyin biz turli xil mos keladigan mashina o'rganish modellaridan foydalandik, ya'ni qaror daraxti, tasodifiy o'rmon, Naive Bayes, KNN modeli, logistik regressiya, SVM, neyron tarmoq va tizma tasniflagichi.

Foydalanilgan internet saytlari:


1.Machine Learning Algorithms for understanding the determinants of under-five Mortality | BioData Mining | Full Text (biomedcentral.com)
2. Regression Algorithms | 5 Regression Algorithms you should know (analyticsvidhya.com)
3. BDMA | NIH Center for Scientific Review
Download 175.42 Kb.

Do'stlaringiz bilan baham:
1   2   3




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling