Data Mining- тегі жіктеу процесі кезеңдері
Жіктеу процесі екі кезеңнен тұрады: модельді жобалау және оны қолдану.
Модельді жобалау: көптеген алдын-ала анықталған сыныптардың сипаттамасы.
Деректер жиынының әрбір мысалы бір алдын ала анықталған сыныпқа қатысты.
Бұл кезеңде оқыту жиынтығы қолданылады, онда модельдің құрылысы жүреді.
Алынған модель жіктеу ережелерімен, шешім ағашымен немесе математикалық формуламен ұсынылған.
Модельді қолдану: жаңа немесе белгісіз мәндерді жіктеу.
Модельдің дұрыстығын (дәлдігін) бағалау.
Сынақ мысалындағы белгілі мәндер алынған модельді пайдалану нәтижелерімен салыстырылады.
Дәлдік деңгейі-сынақ жиынтығындағы дұрыс жіктелген мысалдардың пайызы.
Сынақ жиыны, яғни құрастырылған модель сыналатын жиын оқу жиынына тәуелді болмауы керек.
Егер модельдің дәлдігі қолайлы болса, класы белгісіз жаңа мысалдарды жіктеу үшін модельді қолдануға болады.
Data Mining- тегі кластерлеу процесі
Кластерлеу процесі таңдалған әдіске байланысты және әрдайым қайталанатын болады. Ол қызықты процеске айналуымүмкінжәнеәртүрліпараметрлердітаңдаубойыншакөптегенэксперименттердіқамтуымүмкін, мысалы, қашықтықөлшемдері, айнымалылардыстандарттаутүрі, кластерлер саны жәнет.б. алайда, эксперименттерөздігіненмақсатболмауыкерек - өйткенікластерлеудіңтүпкімақсатызерттелетіндеректердіңқұрылымытуралымазмұндыақпараталуболыптабылады. Алынғаннәтижелерқалыптасқанкластерлердідәлсипаттаумүмкіндігіүшінобъектілердіңқасиеттері мен сипаттамаларыноданәрітүсіндіруді, зерттеудіжәнезерттеудіқажететеді.
Кластерлеусапасынбағалаукелесіпроцедураларнегізіндежүргізілуімүмкін:
қолментексеру;
бақылаунүктелерінбелгілеужәнеалынғанкластерлердетексеру ;
модельгежаңаайнымалылардықосуарқылыкластерлеутұрақтылығынанықтау;
әртүрліәдістердіқолданаотырып, кластерлердіқұружәнесалыстыру.
Кластерлеудіңәртүрліәдістеріәртүрлікластерлердіжасайаладыжәнебұлқалыптыжағдай. Дегенмен, әртүрліәдістерменұқсаскластерлердіқұрукластерлеудіңдұрыстығынкөрсетеді.
Do'stlaringiz bilan baham: |