Ассоциативті ережелерді іздеу мәселесін шешудің ең танымал алгоритмі
Apriori алгоритмі - бұл элементтер жиынтығын жиі талдауға және реляциялық мәліметтер базасындағы Ассоциация ережелерін зерттеуге арналған алгоритм. Ол дерекқордағы жиі жеке элементтерді анықтау және егер бұл элементтер жиынтығы дерекқорда жиі пайда болса, оларды үлкенірек элементтер жиынтығына кеңейту арқылы жүзеге асырылады. Apriori-мен анықталған жиі қолданылатын элементтер жиынтығын мәліметтер базасындағы жалпы тенденцияларды анықтайтын Ассоциация ережелерін анықтау үшін пайдалануға болады: бұл нарықтық себетті талдау сияқты салаларда қолданылады.
Data Mining- тегі жіктеу тапсырмасы
Жіктеу-бұл ең қарапайым және сонымен бірге ең жиі шешілетін Data Mining мәселесі. Жіктеу міндеттерінің таралуына байланысты бұл тұжырымдаманың мәнін нақты түсіну қажет.
Жіктеу-осы объектілер арасындағы ұқсастықты немесе айырмашылықты анықтау үшін таңдалған ұқсас жіктеу белгілері (бір немесе бірнеше қасиеттер) бар объектілердің белгілі бір принцип бойынша реттелген жиынтығы.
Таңдалған белгілерге, олардың комбинацияларына және ұғымдарды бөлу процедураларына байланысты жіктеу болуы мүмкін:
қарапайым-жалпы ұғымды тек белгілері бойынша және барлық түрлер ашылғанға дейін бір рет бөлу. Мұндай жіктеудің мысалы-дихотомия, онда бөлу мүшелері тек екі ұғымға ие, олардың әрқайсысы екіншісіне қайшы келеді (яғни "А және А емес" қағидасы сақталады);
күрделі-әр түрлі негіздер бойынша бір ұғымды бөлу және осындай қарапайым бөлімдерді біртұтас тұтастыққа синтездеу үшін қолданылады. Мұндай жіктеудің мысалы-химиялық элементтердің периодтық жүйесі.
Жіктеу деп объектілерді (бақылаулар, оқиғалар) алдын-ала белгілі сыныптардың біріне жатқызуды түсінеміз.
Data Mining- тегі жіктеу тапсырмасы сақтауды талап ететін ережелер
Жіктеу келесі ережелерді сақтауды талап етеді:
әрбір бөлу актісінде тек бір негіз қолданылуы керек;
бөлу пропорционалды болуы керек, яғни түр ұғымдарының жалпы көлемі бөлінетін жалпы ұғымның көлеміне тең болуы керек;
бөліну мүшелері бір-бірін өзара алып тастауы керек, олардың көлемі қиылыспауы керек;
бөлу дәйекті болуы керек.
Do'stlaringiz bilan baham: |