Texnologiyalari universiteti mustaqil ish mavzu


Download 22.61 Kb.
bet5/7
Sana19.01.2023
Hajmi22.61 Kb.
#1101043
1   2   3   4   5   6   7
Bog'liq
Jo\'lliyev Turg\'un

Outlier tahlili nima?


Chiqib ketish tahlili - bu ma'lumotlar to'plamidagi noodatiy kuzatuvlarni aniqlash jarayoni. Chiqib ketishni aniqlash deb ham ataladi, bu ma'lumotlarni tahlil qilishda muhim qadamdir, chunki u noto'g'ri yoki noto'g'ri kuzatuvlarni olib tashlaydi, aks holda xulosalar noto'g'ri bo'lishi mumkin.
Chiqib ketishni tahlil qilishda qo'llaniladigan texnika va vositalarning keng doirasi mavjud. Biroq, keyinroq ko'rib chiqamiz, ko'pincha uzoq ma'lumotlar nuqtalarini aniqlash juda oson. Natijada, har qanday va barcha ma'lumotlar to'plamida tashqi tahlilni o'tkazmaslik uchun hech qanday bahona yo'q.

Foyda


Boshqa ma'lumotlarni tahlil qilish jarayonlaridan farqli o'laroq , tashqi ko'rsatkichlarni tahlil qilish haqiqatan ham bitta afzalliklarga ega: u tahlil qilinadigan ma'lumotlar to'plamining sifatini yaxshilaydi. Albatta, bu o'z navbatida foyda keltiradi. Yuqori sifatli ma'lumotlar to'plami bilan tahlilchilar aniqroq xulosalar chiqarishni kutishlari mumkin (va ulardan ko'proq).

Qachon tashqi tahlilni o'tkazish kerak


Yuqorida aytib o'tilganidek, har qanday ma'lumotlarni tahlil qilish protsedurasining bir qismi sifatida chetga chiqish tahlili amalga oshirilishi kerak. Bunday holda, tashqi tahlil ma'lumotlarni tahlil qilishning birinchi qadamlaridan biri bo'lishi kerak. Shunday qilib, ma'lumotlar to'plami haqiqatan ham ma'lumotlarni baholash va sharhlashni o'z ichiga olgan bosqichlarga yetganda, har qanday cheklov allaqachon o'chiriladi.


Cheklangan tahlil usullari


Ma'lumotlar to'plamlaridagi chegaralarni aniqlash uchun ishlatilishi mumkin bo'lgan turli xil texnikalar mavjud. Ushbu bo'limda biz oddiy va murakkab usullarni o'z ichiga olgan bir nechta texnikani ko'rib chiqamiz.

Tartiblash


Havaskor ma'lumotlar tahlilchisi uchun saralash - bu ko'rsatkichlarni tahlil qilishning eng oson usuli. Asosiysi oddiy: ma'lumotlar to'plamini har qanday turdagi ma'lumotlarni manipulyatsiya qilish vositasiga (masalan, elektron jadval) yuklang va qiymatlarni kattaligi bo'yicha tartiblang. Keyin, turli ma'lumotlar nuqtalarining qiymatlari oralig'iga qarang. Agar biron bir ma'lumot nuqtalari ma'lumotlar to'plamidagi boshqalardan sezilarli darajada yuqori yoki pastroq bo'lsa, ular chetlab o'tilganlar sifatida ko'rib chiqilishi mumkin.
Saralashdan samarali foydalanish uchun ma'lumotlar to'plamida qanday qiymatlar oralig'ini kutish kerakligini bilish foydali bo'ladi. Natijada, ma'lum turdagi ma'lumotlar bilan yaxshi tanish bo'lgan kishi, ushbu yondashuvdan foydalangan holda, chet elliklarni aniqlashda ancha mohir bo'ladi.
Amalda tartiblash misolini ko'rib chiqamiz. Olimlar yuz xil shokolad barlaridagi kaloriyalarni o'lchaganini o'ylab ko'ring. Ma'lumotlarni tahlil qilish bosqichiga kirgandan so'ng, ular ma'lumotlar to'plamida hech qanday cheklov yo'qligiga ishonch hosil qilishlari kerak. Eng yuqori qiymatlardan saralash orqali ular noodatiy yuqori kuzatuvlarni aniqlay oladilar. O'rtacha shokolad barida bir necha yuz kaloriya borligini bilgan holda, bir necha ming kaloriya kuzatilishi aniq ustunlik sifatida ajralib turadi.

Download 22.61 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling