Data Mining- тегі жіктеу процесі кезеңдері
Жіктеу процесі екі кезеңнен тұрады: модельді жобалау және оны қолдану.
Модельді жобалау: көптеген алдын-ала анықталған сыныптардың сипаттамасы.
-
Деректер жиынының әрбір мысалы бір алдын ала анықталған сыныпқа қатысты.
-
Бұл кезеңде оқыту жиынтығы қолданылады, онда модельдің құрылысы жүреді.
-
Алынған модель жіктеу ережелерімен, шешім ағашымен немесе математикалық формуламен ұсынылған.
Модельді қолдану: жаңа немесе белгісіз мәндерді жіктеу.
-
Модельдің дұрыстығын (дәлдігін) бағалау.
-
Сынақ мысалындағы белгілі мәндер алынған модельді пайдалану нәтижелерімен салыстырылады.
-
Дәлдік деңгейі-сынақ жиынтығындағы дұрыс жіктелген мысалдардың пайызы.
-
Сынақ жиыны, яғни құрастырылған модель сыналатын жиын оқу жиынына тәуелді болмауы керек.
-
Егер модельдің дәлдігі қолайлы болса, класы белгісіз жаңа мысалдарды жіктеу үшін модельді қолдануға болады.
-
Data Mining- тегі кластерлеу процесі
Кластерлеу процесі таңдалған әдіске байланысты және әрдайым қайталанатын болады. Ол қызықты процеске айналуымүмкінжәнеәртүрліпараметрлердітаңдаубойыншакөптегенэксперименттердіқамтуымүмкін, мысалы, қашықтықөлшемдері, айнымалылардыстандарттаутүрі, кластерлер саны жәнет.б. алайда, эксперименттерөздігіненмақсатболмауыкерек - өйткенікластерлеудіңтүпкімақсатызерттелетіндеректердіңқұрылымытуралымазмұндыақпараталуболыптабылады. Алынғаннәтижелерқалыптасқанкластерлердідәлсипаттаумүмкіндігіүшінобъектілердіңқасиеттері мен сипаттамаларыноданәрітүсіндіруді, зерттеудіжәнезерттеудіқажететеді.
Кластерлеусапасынбағалаукелесіпроцедураларнегізіндежүргізілуімүмкін:
-
қолментексеру;
-
бақылаунүктелерінбелгілеужәнеалынғанкластерлердетексеру ;
-
модельгежаңаайнымалылардықосуарқылыкластерлеутұрақтылығынанықтау;
-
әртүрліәдістердіқолданаотырып, кластерлердіқұружәнесалыстыру.
Кластерлеудіңәртүрліәдістеріәртүрлікластерлердіжасайаладыжәнебұлқалыптыжағдай. Дегенмен, әртүрліәдістерменұқсаскластерлердіқұрукластерлеудіңдұрыстығынкөрсетеді.
-
Do'stlaringiz bilan baham: |