Oddiy logistik regressiya
Model
Chiqish = 0 yoki 1
Gipoteza => Z = WX + B
hΘ (x) = sigmasimon (Z)
Sigmoid funktsiyasi
Shakl 2: Sigmoidni faollashtirish funktsiyasi
Agar "Z" cheksizlikka o'tadigan bo'lsa, Y (taxmin qilingan) 1 ga, "Z" salbiy cheksizlikka o'tadigan bo'lsa, Y (taxmin qilingan) 0 ga aylanadi.
Gipotezani tahlil qilish
Gipotezadan chiqadigan narsa taxmin qilingan ehtimollikdir. Bu kirish X berilganida taxmin qilingan qiymatning haqiqiy qiymatga qanchalik ishonchliligini aniqlash uchun ishlatiladi. Quyidagi misolni ko'rib chiqing,
X = [x0 x1] = [1 IP-manzil]
X1 qiymatiga asoslanib, taxminiy ehtimollik 0,8 ga teng deb topdik. Bu elektron pochtaning spam bo'lish ehtimoli 80% ekanligini bildiradi.
Matematik jihatdan quyidagicha yozilishi mumkin:
3-rasm: Matematik vakillik
Bu "logistik regressiya" nomini oqlaydi. Ma'lumotlar chiziqli regressiya modeliga mos keladi, keyinchalik u maqsadli kategorik bog'liq o'zgaruvchini bashorat qiladigan logistik funktsiya bilan ishlaydi.
Logistik regressiya turlari
1. Ikkilik logistik regressiya
Kategorik javob faqatgina ikkita ikkita mumkin bo'lgan natijalarga ega. Misol: Spam yoki yo'q
2. Multinomial Logistik regressiya
Uch yoki undan ortiq toifalar buyurtma bermasdan. Misol: Qaysi ovqat ko'proq afzal bo'lishini taxmin qilish (Veg, Veg bo'lmagan, Vegan)
3. Oddiy logistik regressiya
Buyurtma bilan uch yoki undan ortiq toifalar. Misol: Filmning reytingi 1 dan 5 gacha
Qaror chegarasi
Ma'lumotlar qaysi sinfga tegishli ekanligini taxmin qilish uchun chegara o'rnatilishi mumkin. Ushbu chegara asosida olingan taxminiy ehtimollik sinflarga bo'linadi.
Aytaylik, agar predict_value ≥ 0,5 bo'lsa, u holda elektron pochtani spam emas deb hisoblang.
Qaror chegarasi chiziqli yoki chiziqli bo'lishi mumkin. Murakkab qaror chegarasini olish uchun polinom tartibini oshirish mumkin.
Do'stlaringiz bilan baham: |