Data mining жауаптары! Data mining негізгі ерекшелігі


OLAP және Data mining арасындағы байланыс


Download 0.76 Mb.
bet15/30
Sana18.06.2023
Hajmi0.76 Mb.
#1582679
1   ...   11   12   13   14   15   16   17   18   ...   30
Bog'liq
Data mining сұрақтар жауабымен (1)-3

OLAP және Data mining арасындағы байланыс

Қазіргі уақытта жедел аналитикалық өңдеуді (OLAP жүйелерін) пайдалану қарқынды жүріп жатыр. OLAP көп өлшемді деректерге қол жеткізуді қамтамасыз етумен шектеледі. Data mining технологиясы OLAP-қа деген қызығушылық тудырады, өйткені оның көмегімен деректерді ең терең және жан-жақты талдауға болады.


  1. Data Mining процесі

Data Mining процесі зерттеудің бір түрі болып табылады. Кез-келген зерттеу сияқты, бұл процесс салыстыру, теру, жіктеу, жалпылау, абстракциялау, қайталау элементтерін қамтитын белгілі бір кезеңдерден тұрады. Data Mining процесі шешім қабылдау процесімен тығыз байланысты. Data Mining процесі модель жасайды және шешім қабылдау процесінде жұмыс істейді.


  1. Data Mining процесінің кезеңдері және олардың міндеті

Data Mining процесі келесі кезеңдерді қамтиды:

  • пәндік саланы талдау ;

  • тапсырма қою;

  • деректерді дайындау;

  • модельдерді құру;

  • модельдерді тексеру және бағалау;

  • модельді таңдау;

  • модельді қолдану;

  • модельді түзету және жаңарту.

1-кезең.Пәндік саланы таңдау
Зерттеу дегеніміз-белгілі бір объективті объектіні немесе құбылысты белгілі бір мақсатпен тану процесі.
Зерттеу процесі зерттеуші субъектінің көзқарасы бойынша осы қасиеттердің көрсеткіштері арасындағы маңызды қатынастарды анықтау және бағалау мақсатында объектілердің қасиеттерін бақылаудан тұрады. Бағдарламалық жасақтаманы әзірлеу саласындағы кез-келген мәселені шешу пәндік саланы зерттеуден басталуы керек. Пәндік аймақ қасиеттері бойынша ерекшеленетін және бір-бірімен белгілі бір қатынастарда болатын немесе қандай да бір жолмен өзара әрекеттесетін объектілерден тұрады.
Пәндік сала-бұл нақты әлемнің бөлігі, ол шексіз және зерттеу тұрғысынан маңызды және маңызды емес деректерді қамтиды.
Зерттеуші олардың маңызды бөлігін ажырата білуі керек. Мысалы, "несие беру керек пе?"клиенттің жеке өмірі туралы барлық деректер маңызды, оның ішінде жұбайының жұмысы бар ма, клиенттің кәмелетке толмаған балалары бар ма, оның білім деңгейі қандай және т.б. банктік қызметтің басқа мәселесін шешу үшін бұл деректер мүлдем маңызды болмайды. Осылайша, деректердің маңыздылығы пәндік аймақты таңдауға байланысты. Пәндік саланы зерттеу барысында оның моделі жасалуы керек. Әр түрлі көздерден алынған білім қандай да бір құралдардың көмегімен рәсімделуі керек. Бұл тақырыптық аймақтың мәтіндік сипаттамалары немесе арнайы графикалық белгілер болуы мүмкін. Пәндік аймақты сипаттаудың көптеген әдістері бар: мысалы, SADT құрылымдық талдау әдістемесі және оған негізделген IDEF0, Гейн-Сарсон деректер ағындарының диаграммалары, UML объектіге бағытталған талдау әдістемесі және басқалар. Домен моделі процестердің пайда болуын сипаттайды.
2 кезең. Тапсырма қою
Data Mining тапсырмасын қою келесі қадамдарды қамтиды:
тапсырманы тұжырымдау;
тапсырманы рәсімдеу.
Тапсырма сонымен қатар зерттелетін объектілердің статикалық және динамикалық мінез-құлқын сипаттауды қамтиды.
Мәселенің мысалы. Жаңа өнімді нарыққа шығарған кезде, компания клиенттерінің қай тобы осы өнімге көбірек қызығушылық танытатынын анықтау қажет.
Статиканың сипаттамасы объектілер мен олардың қасиеттерін сипаттауды білдіреді.
3 кезең. Деректерді дайындау
Кезеңнің мақсаты:
Data Mining үшін мәліметтер базасын құру.
Деректерді дайындау ең маңызды кезең болып табылады, оның сапасы бүкіл Data Mining процесінің сапалы нәтижелерін алу мүмкіндігіне байланысты. Сонымен қатар, кейбір бағалаулар бойынша деректерді дайындау кезеңіне жобаға бөлінген барлық уақыттың 80% - ы жұмсалуы мүмкін екенін есте ұстаған жөн.



  1. Download 0.76 Mb.

    Do'stlaringiz bilan baham:
1   ...   11   12   13   14   15   16   17   18   ...   30




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling