Kirish bob. Tibbiy biologik ma'lumotlarni tahlil qilish va qayta ishlash usullari, algoritmlari va tizimlarini tahlil qilish


Download 0.53 Mb.
bet8/15
Sana31.03.2023
Hajmi0.53 Mb.
#1313295
1   ...   4   5   6   7   8   9   10   11   ...   15
Bog'liq
2 5462995905688901647

Fisherning aniq mezoni
χ2 mezoni 2x2 tasodifiy jadvallarni tahlil qilish uchun mos keladi, agar uning biron bir katakchasida kutilgan qiymatlar 5 dan kam bo'lmasa. Kuzatuvlar soni kam bo'lsa, bu shart bajarilmaydi va c χ2 mezoniga amal qilish mumkin emas. Bunday holda, Fisherning aniq mezoni qo'llaniladi. Bu ma'lum guruhlar uchun favqulodda vaziyatlar jadvalini to'ldirishning barcha mumkin bo'lgan variantlarini sanab o'tishga asoslangan, shuning uchun u qanchalik kichik bo'lsa, uni qo'llash osonroq bo'ladi.

1.3. Tibbiy ma'lumotlarning bog'liqligini o'rganish.


Ma'lumotlarni tahlil qilishning ushbu bosqichida o'zgaruvchilar orasidagi bog'liqliklar o'rganiladi [19,20]. Buning uchun korrelyatsiya tahlili (raqamli qiymat sifatida ifodalangan o'zgaruvchilar o'rtasida bog'liqlik mavjudligi yoki yo'qligi faktini aniqlash uchun), shuningdek, regressiya tahlili (tenglama yoki grafik shaklida ifodalangan va o'zgaruvchilar o'rtasidagi miqdoriy bog'liqlikni topish uchun) qo'llaniladi va ko'pincha oxirgi marta omil tahlili qo'llaniladi (1.2-rasm).
Korrelyatsiya tahlili
Korrelyatsiya - ikki yoki undan ortiq o'zgaruvchilar o'rtasidagi bog'liqlik (oxirgi holatda korrelyatsiya ko'plik yoki to’plamli deb ataladi). Korrelyatsiya tahlilining maqsadi bu munosabatlarning mavjudligi yoki yo'qligini aniqlashdir.

1.2-rasm. O'zgaruvchilar orasidagi bog'liqlikni topishning statistik usullari.

Agar ikkita o'zgaruvchi mavjud bo'lib, ularning qiymatlari nisbatlar shkalasida o'lchansa, Pirsonning chiziqli korrelyatsiya koeffitsienti r qo'llaniladi, bu -1 dan +1 gacha qiymatlarni qabul qiladi (uning nol qiymati korrelyatsiya yo'qligini ko'rsatadi).


"Chiziqli" atamasi o'zgaruvchilar o'rtasida chiziqli munosabatlar mavjudligi tekshirilayotganligini ko'rsatadi.
Regressiya tahlili.
Korrelyatsiya tahlilidan farqli o'laroq, regressiya tahlili mustaqil o'zgaruvchi bilan bir yoki bir nechta qaram o'zgaruvchilar o'rtasida bog'liqlik mavjudligini ko'rsatibgina qolmay, balki bu munosabatni miqdoriy jihatdan baholash imkonini beradi. Chiziqli va chiziqli bo'lmagan regressiya tahlilining bir nechta turlari mavjud bo'lib, ular bir nechta o'zgaruvchilar orasidagi matematik bog'lanishni topishga imkon beradi, ammo bu usullarning barchasi parametrikdir, bu esa ulardan sifatli ma'lumotlarni qayta ishlash uchun foydalanishni imkonsiz qiladi. Ko'plik regressiyaning parametrik bo'lmagan analogi - bu bog’lanish xususiyatning ikkilik darajasi (gradatsiyasi) (ikkilik mantiqiy regressiya) va undan ko'p bog’lanishda (ko'p nomli mantiqiy regressiya).
Ikkilik mantiqiy regressiya
Ikkilik mantiqiy regressiya usulidan foydalanib, ikkilik (ikkilik, faqat 2 ta toifali qiymatga ega) o'zgaruvchilarning har qanday shkalasiga ega bo'lgan mustaqil o'zgaruvchilarga bog'liqligini tekshirish mumkin. Qoida tariqasida, dixotomiyali o'zgaruvchilarda, sodir bo'lishi mumkin bo'lgan yoki bo'lmasligi mumkin bo'lgan ba'zi bir hodisa haqida gapiramiz; ikkilik mantiqiy regressiya bu holda har bir o'zgaruvchi uchun regressiya koeffitsientlari aniqlash va uning statistik ahamiyati bilan mustaqil o'zgaruvchilar qiymatlariga qarab hodisaning yuzaga kelish ehtimolini hisoblab chiqadi.
Ikkilik hodisaning yuzaga kelish ehtimoli quyidagi formula bilan hisoblanadi:

Bu erda X - mustaqil o'zgaruvchilarning qiymatlari, bj - koeffitsientlar, ularni hisoblash binar mantiqiy regressiya vazifasi bo'lib, а - olingan regressiya tenglamasining doimiysi hisoblanadi.
Agar hisoblangan ehtimollik 0,5 dan kichik qiymatga ega bo'lsa, u holda voqea sodir bo'lmaydi deb taxmin qilish mumkin, aks holda, voqea sodir bo'ladi deb taxmin qilinadi.
Olingan regressiyadagi koeffitsientlar X ni o'zgartirish effekti sifatida talqin qilinmasligi kerak. To'g'ri talqin qilish uchun X parametriga nisbatan mantiqiy funktsiyaning hosilasini topish va X o'zgaruvchining (odatda o'rtacha qiymat sifatida hisoblanadi) o'ziga xos qiymati uchun chegara effektini hisoblash kerak.
95% ishonch oralig'ini hisobga olgan holda mantiqiy regressiya koeffitsientlarining eksponentlari barcha taqdim etilgan statistik ahamiyatga ega o'zgaruvchilar yig'indisida taqdim etilgan o'zgaruvchi uchun o'rganilayotgan ikkilik hodisaning yuzaga kelish ehtimolini baholash uchun koeffitsientlar sifatida ishlatiladi.
Multinominal logistik regressiya
Bu usul mantiqiy regressiya variantidir, bunda erksiz o'zgaruvchi ikki toifadan ortiq bo'ladi. Ikkilik mantiqiy regressiya uzluksiz miqyosda mustaqil o'zgaruvchiga ega bo'lishi mumkin bo'lsada, multinominal mantiqiy regressiya faqat toifali mustaqil o'zgaruvchilar uchun mos keladi.
Ko'p nomli mantiqiy regressiyani qurish uchun mustaqil o'zgaruvchining n + 1 mumkin bo'lgan qiymatlari uchun n ta takroriy logit tuziladi va bitta toifadan havola sifatida foydalaniladi, uning koeffitsientlari 0 ga teng:

b10, b11 b20 va b21 koeffitsientlarini topish (parametrik baholar deb ataladi) multinomial mantiqiy regressiyaning asosiy vazifasidir. Indeksning birinchi raqami logit sonini, ikkinchisi esa berilgan mantiqdagi koeffitsientning tartib raqamini, indeksning ikkinchi o'rnidagi 0 raqami esa doimiyni, keyin esa aynan shuncha koeffitsientni, hisobga olingan mustaqil o'zgaruvchilar (omillar) sonini bildiradi. Oxirgi (mos yozuvlar) toifadagi koeffitsientlarga 0 qiymati beriladi.
Takrorlanmaydigan logitlar uchun qiymatlarga ega bo'lganingizdan so'ng, logarifm qoidalaridan foydalanib, takroriy logit qiymatlarini hisoblashingiz mumkin.

Shuni ta'kidlash kerakki, har bir toifa uchun ehtimollikni to'g'ridan-to'g'ri aniqlash ushbu ehtimolliklarning bir-biriga nisbatidan ko'ra ancha axborolidir. Bog'liq o'zgaruvchilarning har bir toifasi uchun bu ehtimolni quyidagi formula yordamida hisoblash mumkin:

Agar bitta mustaqil o'zgaruvchi bo'lsa, bunday noqulay usuldan foydalangan holda hisoblash juda ma'nosiz - barcha munosabatlarni tasodifiy jadvallar yordamida osonroq aniqlash mumkin.

1.4. Omilli tahlilda asosiy komponentlarni ajratib olish.


Biologik, shu jumladan tibbiy tadqiqotlarda har doim juda ko'p umumiy o'rganilgan munosabatlar mavjud [21]. Biroq, ularning ko'pchiligi statistik jihatdan ahamiyatsiz bo'ladi va klinik ahamiyatga ega bo'lmaganda, ularni hisobga olish va izohlash kerak emas. O'zaro munosabatlarni o'rganish uchun belgilangan maqsadlar nuqtai nazaridan qancha munosabatlar qimmatli bo'lishini oldindan aytish mumkin emas. Qoida tariqasida, barcha mumkin bo'lgan ulanishlarning
52,5% statistik va klinik ahamiyatga ega.
Bundan tashqari, ko'plab ko'rsatkichlar o'zaro bog'liqliklarga ega bo'lishi mumkin. Ularni xususiyatlarning boshlang'ich kichik to'plami sifatida ishlatib, omillar tahlili yordamida ular asosida yanada murakkab, integral xususiyatlarni qurish muammosini qo'yish va hal qilish mumkin. Bunday holda, bunday murakkab xususiyatlar (indekslar) soni dastlabki xususiyatlar sonidan sezilarli darajada kam bo'ladi. Ushbu protsedura natijasida biz har bir asl xususiyatga qaraganda ancha katta hajmdagi ma'lumotlarni ixcham olib yuradigan yangi xususiyatlarni olamiz. Natijada, tasodifiy komponentni filtrlash va dastlabki belgilarning tuzilishi va o'rganilayotgan bemorlar guruhlari tuzilishi haqida ishonchli ma'lumot olish mumkin bo'ladi.
Faktorli tahlil.
Faktorli tahlil - bu mavjud kuzatishlar bilan bog'liq bo'lgan ko'p sonli o'zgaruvchilarni omillar (omillar komplekslari, komponentlar) deb ataladigan kichikroq miqdordagi mustaqil ta'sir qiluvchi miqdorlarga qisqartirish tartibi. Bunday holda, bir-biri bilan kuchli bog'langan o'zgaruvchilar bir omilga birlashtiriladi. Turli omillarning o'zgaruvchilari bir-biri bilan zaif bog'lanishga ega. Shunday qilib, omil tahlilining maqsadi mavjud o'zgaruvchilar o'rtasidagi kuzatilgan munosabatlarni iloji boricha to'liq tushuntiradigan murakkab omillarni topishdir. Faktorli tahlil yordamida kuzatilayotgan oʻzgaruvchilar oʻrtasida chiziqli statistik bogʻlanishlar (korrelyatsiyalar) mavjudligi uchun masʼul boʻlgan yashirin (latent) oʻzgaruvchan omillarni aniqlash mumkin.
Ikki xil o'zgaruvchi o'rtasidagi kuchli munosabatlar tadqiqotdagi ikkita elementning ortiqchaligini ko'rsatadi. O'zgaruvchilar o'rtasidagi munosabatni yoyilish diagrammasi yordamida topish mumkin. Approksimatsiya (o'rnatish) natijasida olingan regressiya chizig'i bog'liqlikning grafik tasvirini beradi. Agar ushbu diagrammada tasvirlangan regressiya chizig'i asosida yangi o'zgaruvchi aniqlansa, bunday o'zgaruvchi ikkala o'zgaruvchining eng muhim xususiyatlarini o'z ichiga oladi. Yangi omil aslida ikkita asl o'zgaruvchining chiziqli birikmasidir.
Faktorli tahlilda asosiy komponentlarni tanlash o'rganilayotgan o'zgaruvchilarning tarqalish diagrammasi bo'yicha amalga oshiriladi. Asosiy komponentlarni ajratib olish tartibi o'zgaruvchilarning boshlang’ich fazosining dispersiyasini maksimal darajaga keltiradigan aylanishga o'xshaydi. Misol uchun, tarqalish chizmasida siz regressiya chizig'ini regressiya chizig'iga mos keladigan tarzda aylantirib, uni X o'qi sifatida ko'rishingiz mumkin. Aylanishning bu turi dispersiyani maksimallashtiruvchi aylanish deb ataladi, chunki aylanish mezoni (maqsad) “yangi” o‘zgaruvchining (omil, faktor kompleksi) dispersiyasini (o‘zgaruvchanligini) maksimal darajaga ko‘tarish va uning atrofidagi tarqalishni minimallashtirishdir.
Dispersiya maksimal bo'lgan chiziq topilgandan so'ng, uning atrofida ma'lumotlarning bir nechta tarqalishi qoladi va protsedura takrorlanadi. Asosiy komponentlar tahlilida aynan shunday amalga oshiriladi: birinchi omil chiqarilgandan so'ng, ya'ni birinchi qator chizilgandan so'ng, qoldiq o'zgarishlarni maksimal darajada oshiradigan keyingi qator aniqlanadi (birinchi qator atrofida ma'lumotlarning tarqalishi), va hokazo. Shunday qilib, omillar ketma-ket taqsimlanadi. Har bir keyingi omil avvalgilaridan qolgan o'zgaruvchanlikni maksimal darajaga ko'taradigan tarzda aniqlanganligi sababli, omillar bir-biridan mustaqil bo'lib chiqadi. Boshqacha qilib aytganda, korrelyatsiyasiz yoki ortogonal. Takroriy iteratsiyalarda kamroq va undanam kamroq dispersiyaga ega omillar farqlanadi.
Yangi omillar majmuasida (komponentda) o'rganilayotgan o'zgaruvchini baholash komponentlar matritsasida o'zgaruvchining vektor yuki bilan ifodalanadi, bu o'z mohiyatiga ko'ra o'zgaruvchi va yangi omillar kompleksi (komponent) o'rtasidagi munosabatlarning korrelyatsiya koeffitsienti hisoblanadi. Qaysi tarkibiy qismlar matritsasi, statistik ishlov berish natijalarida aylantirilgan qaror bilan yoki bo'lmasdan, komponentdagi o'zgaruvchilarning bog'liqligi va tarkibiy qismlar sonining klinik jihatdan muvofiqligini hisobga olgan holda va tavsiflovchi tadqiqotchining tanloviga bog'liq.

1.5. Tibbiy ma'lumotlarning tasnifi va prognozi.


Statistik ma'lumotlarni tahlil qilishning muhim vazifasi tasniflashdir. Tasniflash nazariyasining uchta kichik sohasini ajratish odatiy holdir: guruhlash, diskriminatsiya (diskriminant tahlil) va klasterlash (klaster tahlili) [25].
Guruh tahlili. Tadqiqot ob'ektlarini tasniflashda tez-tez qo'llaniladigan yondashuv rejalashtirilgan guruhlash bo'lishi mumkin. Bunday yondashuv bilan guruhlarga bo'linish tadqiqotchining o'zi tomonidan shartli ravishda amalga oshiriladi. Tanlangan tadqiqot shu tamoyilga asoslanadi.
Tanlangan tadqiqot - bunda tanlangan odamlar guruhi (namuna) ma'lum vaqt davomida kuzatiladi. Ushbu tanlovning turli kichik guruhlaridagi sub'ektlarning natijalari, ayrim xavf omillariga duchor bo'lgan yoki bo'lmaganlar solishtiriladi. Istiqbolli tanlovli tadqiqotda tanlovlar hozirda tayyorlanadi va kelajakda kuzatiladi. Retrospektiv (yoki tarixiy) tanlovli tadqiqotda tanlov arxiv yozuvlaridan tanlab olinadi va ularning natijalari o'sha paytdan to hozirgi kungacha kuzatiladi.
Tanlovli so'rovlar qat'iy yoki dinamik bo'lishi mumkin. Ruxsat etilgan tanlovda bemorlar soni o'zgarishsiz qoladi, agar bemorlar belgilangan tanlovni tark etsa, ular almashtirilmaydi. Dinamik tanlovlarda bemorlarni ham tanlovdan chiqarib tashlash, ham tanlovga yangi bemorlarni kiritish mumkin.
Tanlovli tadqiqotlarning asosiy kamchiliklari ularning yuqori narxidir, bu ham katta tanlovlarni shakllantirish zarurati, ham bemorlarni kuzatish davomiyligi bilan bog'liq. Bundan tashqari, vaqt o'tishi bilan kuzatuv yoki kuzatuvning davomiyligi tadqiqot oxirida bemorni yo'qotishning ko'payishi natijalarni noto'g'ri qilishga intiladi. Bundan tashqari, uzoq vaqt davomida o'lchovlar va natijalar ketma-ketligini saqlab qolish qiyin va kasallikning natijasi, ehtimolligi yoki etiologiyasi o'zgarishi mumkin.
Diskriminant tahlili. Diskriminant tahlilida sinflar (guruhlar) allaqachon berilgan deb faraz qilinadi va vazifa yangi paydo bo'lgan ob'ektni ma'lum bir o'zgaruvchining qiymatidan kelib chiqqan holda ushbu sinflardan biriga kiritishdir. Diskriminant tahlilining asosiy g'oyasi turli xil to’plamlar o'rtacha o'zgaruvchining (yoki o'zgaruvchilarning chiziqli birikmasi) farqlanishini aniqlash va keyin ushbu o'zgaruvchidan yangi a'zolar uchun ularning ma'lum bir guruhga tegishliligini taxmin qilish uchun foydalanishdir. Shunday qilib, yangi xususiyatlar uchun bashoratga asoslangan tasnif mavjud tasnif ma'lumotlari asosida tasniflash funktsiyasi tomonidan qurilgan tasniflash og'irliklarining qiymatiga asoslangan holda quriladi.
Guruhlash va diskriminant tahlilining bitta umumiy kamchiligi bor: bu usullarning ikkalasi ham haqiqiy tuzilmani belgilash o‘rniga tashqaridan tuzilish tartibini keltirib chiqaradi. Ushbu ikki usuldan farqli o'laroq, klaster tahlili namunaviy ma'lumotlarga asoslangan tuzilma tartibini qurish uchun mo'ljallangan va ikkinchi darajali ma'lumotlarni tahlil qilish doirasida tasnifni yaratish vazifasi uchun aniq deb hisoblanadi.
Klaster tahlili. Klaster tahlili - o'rganish ob'ektlarini ham, xususiyatlarni ham alohida mahalliy kichik to'plamlarga (klasterlarga) guruhlash qonuniyatlarini izlash usuli.
Klaster tahlilining vazifasi empirik ma'lumotlarga ko'ra, har bir guruh ichida bir-biriga o'xshash ob'ektlarning keskin turli guruhlarini (klasterlarini) aniqlashdir. Klaster tahlili yordamida tadqiqot ob’ektlarini klasterlarga, xususiyatlarni klasterlarga guruhlash (o‘zgaruvchilar sonini kamaytirish) va bir vaqtning o‘zida tadqiqot ob’yektlari va xususiyatlarini guruhlash mumkin.
Tadqiqot ob'ektlarini klasterlarga guruhlash mavjud tanlovning xar xil ekanligi taxmin qilingan, ammo xar xillik sababi noma'lum bo'lgan hollarda qo'llaniladi. Klasterlash tartibini qo'llash natijasi o'rganish ob'ektlarining bir nechta kichik guruhlarini (klasterlarini) shakllantirish bo'lishi mumkin, ularning har biri o'xshash kuzatishlarni o'z ichiga oladi. Kichik guruhlarni keyingi tahlil qilish ushbu kichik guruhlar bir-biridan farq qiladigan ba'zi ob'ektiv xususiyatlarni aniqlashi mumkin.
Xususiyatlar (yoki xususiyatlar guruhlari) munosabatlarida noma'lum qonuniyatlarni izlash uchun xususiyatlarni klasterlarga guruhlash juda bir xil (kuzatishlar yoki o'rganish ob'ektlari bo'yicha) tanlovda qo'llaniladi. Natijada bir nechta xususiyatlar guruhlarini shakllanishi mumkin, ularning har biri statistik jihatdan ahamiyatli munosabatlarni topish xususiyatlarni o'z ichiga oladi.
Klaster tahlilidan foydalangan holda tadqiqot quyidagi besh asosiy bosqichni tavsiflaydi:
1) klasterlash uchun tanlovni olish;
2) tanlovdagi ob'ektlar baholanadigan xususiyatlar to'plamini va ularni standartlashtirish usulini aniqlash;
3) ob'ektlar o'rtasidagi o'xshashlikning u yoki bu o'lchovi qiymatlarini hisoblash;
4) o'xshash ob'ektlar guruhlarini yaratish uchun klasterli tahlil usulini qo'llash;
5) klaster yechimi natijalarining ishonchliligini tekshirish.
Klaster tahlilini o'tkazish va uning natijalarini sharhlash juda murakkab. 100 ga yaqin turli xil klasterlash algoritmlari mavjud, lekin eng koʻp qoʻllaniladiganlari ierarxik klaster tahlili va k - oʻrtacha klasterlashdir.
Ierarxik usullarda har bir kuzatish avvalo bitta ob'ektdan tashkil topgan o'zining alohida klasterini hosil qiladi. Birinchi bosqichda ikkita qo'shni klaster birlashtiriladi; bu jarayon faqat ikkita klaster qolguncha davom etishi mumkin. Klasterlar orasidagi masofa ikkala klasterning barcha mumkin bo'lgan juft nuqtalari orasidagi barcha masofalarning o'rtacha qiymatidir.
Klaster tahlili yakunida olingan asosiy ma'lumot - bu ma'lum bir kuzatishning ma'lum bir klasterga tegishliligi. Bundan tashqari, klaster tahlili natijasida klasterlar boʻyicha oʻrtacha koʻrsatkichlar, dendrogrammalar, dispersiya tahlili kabi koʻrsatkichlar, bir qator dasturlarda esa klaster markazigacha boʻlgan oʻrtacha masofa (klasterlarning har biri uchun), maksimal va minimal masofa va mos ravishda klaster markaziga eng uzoq va eng yaqin kuzatuv (ushbu klasterning odatiy vakili), shuningdek klaster bo'linishi bilan izohlangan masofa dispersiyasining ulushi (aniqlash koeffitsienti) R) va boshqalar kabi muhim maʼlumotlar ajratiladi.
Klaster tahlili natijalarining barqarorligini tekshirishning mumkin bo'lgan usullaridan biri sifatida turli klasterlash algoritmlari uchun olingan natijalarni taqqoslash usulidan foydalanish mumkin. Klasterlangan natijaning barqarorligini tekshirishning yana bir usuli bu boshlang’ich tanlovni tasodifiy ravishda ikkita taxminan teng qismga bo'lish, ikkala qismni ham klasterlash va keyin natijalarni solishtirishdir. Klasterlash sifatini baholashda kamroq muammolar paydo bo'ladi, chunki klaster echimini optimallashtirish uchun universal mezon yo'q. Tadqiqotning ushbu bosqichida topilgan klaster yechimining optimal ekanligini tasdiqlashning eng yaxshi usuli bu faqat ushbu yechimning ko'p o'lchovli statistikaning boshqa usullari yordamida olingan xulosalar bilan muvofiqligi yoki olingan yechimning boshqa ob'ektlardagi bashoratli xulosalarini tekshirishdan iborat.


Download 0.53 Mb.

Do'stlaringiz bilan baham:
1   ...   4   5   6   7   8   9   10   11   ...   15




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling