Amalda logistik regressiya chiziqli ajratiladigan sinflar bilan sinflashtirish masalalarini hal qilish uchun ishlatiladi. Logistik regressiya bu regressiya va sinflashtirish muammosini hal qilish uchun foydali klassik vositadir. ROC tahlili - bu modellarning sifatini tahlil qilish uchun qurilma. Ikkala algoritm ham tibbiyotda modellar yaratish va klinik tadqiqotlar o'tkazish uchun faol foydalaniladi. Logistik regressiya qarz oluvchilar reytingini hisoblash va kredit riskini boshqarish uchun ballni baholashda keng tarqaldi. Shuning uchun, statistik ma'lumotlardan "kelib chiqishi" ga qaramay, logistik regressiya va ROC tahlilini deyarli har doim Data Mining algoritmlari to'plamida ko'rish mumkin. ROC-analizi ROC egri chizig'i (Qabul qiluvchi operatorning xarakteristikasi) - mashinani o'rganishda ikkilik sinflashtirish natijalarini ko'rsatish uchun eng ko'p ishlatiladigan egri chiziqdir. Ism signalni qayta ishlash tizimlaridan olingan. Ikkita sinf mavjud bo'lganligi sababli, ulardan biri ijobiy natijalarga ega bo'lgan sinf deb ataladi, ikkinchisi salbiy natijalarga ega. ROC egri chizig'i to'g'ri sinflashtirilgan ijobiy misollar sonining noto'g'ri sinflashtirilgan salbiy misollar soniga bog'liqligini ko'rsatadi. ROC tahlilining terminologiyasida birinchisi haqiqiy ijobiy, ikkinchisi esa noto'g'ri salbiy deb ataladi. Bunday holda, klassifikator ma'lum bir parametrga ega deb taxmin qilinadi, u o'zgarib, biz u yoki bu bo'linishni ikki sinfga olamiz. Ushbu parametr ko'pincha kesish qiymati deb ataladi. Bunga qarab, I va II turdagi xatolarning turli qiymatlari olinadi. Logistik regressiyada kesish chegarasi 0 dan 1 gacha - bu regressiya tenglamasining hisoblangan qiymati. Keling, buni reyting deb ataymiz. ROC-analizi I va II turdagi xatolarning mohiyatini tushunish uchun model bo'yicha sinflashtirish natijalari va misollarning sinflarga haqiqiy (ob'ektiv) tegishliligi asosida qurilgan to'rtta maydonli chalkashlik matritsasini ko'rib chiqamiz.
Do'stlaringiz bilan baham: |