Data mining жауаптары! Data mining негізгі ерекшелігі


Download 0.76 Mb.
bet20/30
Sana18.06.2023
Hajmi0.76 Mb.
#1582679
1   ...   16   17   18   19   20   21   22   23   ...   30
Bog'liq
Data mining сұрақтар жауабымен (1)-3

SEMMA әдістемесі

SEMMA әдістемесі SAS data Mining Solution (SAS) ортасында жүзеге асырылады . Оның аббревиатурасы Sample ("деректерді таңдау", яғни үлгіні құру), Explore ("деректердегі қатынастарды зерттеу"), Modify ("деректерді өзгерту"), Model ("өзара тәуелділікті модельдеу"), Assess ("алынған модельдер мен нәтижелерді бағалау") сөздерінен құралған.
Semma тәсілі барлық процестер деректерді өңдеу және талдау бойынша барлық қажетті жұмыстарды орындауды қолдайтын икемді қабық шеңберінде орындалатынын білдіреді. SEMMA тәсілі процестің құрылымдылығын және әр қадамның орындалуын қолдайтын құралдардың логикалық ұйымдастырылуын біріктіреді. Деректерді өңдеу процесінің диаграммалары арқылы SEMMA тәсілі Статистикалық зерттеу және визуализация әдістерін қолдануды жеңілдетеді, ең маңызды айнымалыларды таңдауға және түрлендіруге, нәтижелерді болжау, модельдің дәлдігін растау және модельді орналастыруға дайындау үшін осы айнымалылармен модельдер жасауға мүмкіндік береді.
Бұл әдістеме ешқандай қатаң ережелерді таңдамайды. Semma әдіснамасын қолдану нәтижесінде әзірлеушіде жоба тұжырымдамасын құрудың, оны іске асырудың, сондай-ақ жобалау нәтижелерін бағалаудың ғылыми әдістері болуы мүмкін.
KDnuggets (2004 ж.) соңғы сауалнамаларының нәтижелері бойынша сауалнамаға қатысқан адамдардың 42%-ы crisp - DM әдіснамасын, 10% - ы SEMMA әдіснамасын, 6% - ы ұйымның өзіндік әдіснамасын, 28% - ы өзінің әдіснамасын, басқа әдіснамаларды респонденттердің 6% - ы пайдаланады. Сауалнамаға қатысқандардың 7% - ы ешқандай әдіснаманы қолданбайды.


  1. PMML стандарты және оның негізгі мақсаты

Рmml (Predictive Modeling mark-up Language) стандарты - болжамды (немесе болжамды) модельдерді сипаттау тілі немесе болжамды модельдеуге арналған белгілеу тілі.
PMML Data Mining үлгілерін сақтау және тасымалдау стандарттары тобына жатады.
Бұл стандартты әзірлеуді және енгізуді DMG it-консорциумы (Data Mining Group) жүргізеді. DMG - деректерді талдау саласындағы бағдарламалық жасақтаманы әзірлейтін барлық жетекші компанияларды қамтитын топ.
Бұл стандарттың негізі-XML тілі. XML тіліне негізделген басқа стандарттың мысалы статистикалық мәліметтер мен метадеректермен алмасу стандарты болып табылады. Pmml стандарты Data Mining модельдері мен статистикалық модельдерді сипаттау үшін қолданылады.
PMML стандартының негізгі мақсаты-әртүрлі әзірлеушілердің бағдарламалық жасақтамасы арасында деректер модельдерімен алмасу мүмкіндігін қамтамасыз ету.
PMML стандартының көмегімен үйлесімді қосымшалар деректер модельдерін басқа PMML құралдарымен оңай бөлісе алады. Осылайша, бір бағдарламалық өнімде жасалған модельді екіншісінде болжамды модельдеу үшін пайдалануға болады.
PMML жақтастарының айтуынша, бұл стандарт "Data Mining-ті демократиялық етеді", көптеген пайдаланушыларға Data Mining өнімдерін пайдалануға мүмкіндік береді. Бұған бұрын жасалған деректер модельдерін пайдалану мүмкіндігі арқылы қол жеткізіледі. PMML деректер модельдерін қалағаныңызша жиі қолдануға мүмкіндік береді және олармен практикалық жұмыста айтарлықтай көмектеседі.
PMML стандартына мыналар кіреді:
талданатын деректердің сипаттамасы (мәліметтер құрылымы мен түрлері);
талдау схемасының сипаттамасы (пайдаланылатын деректер өрістері);
деректер түрлендірулерінің сипаттамасы (мысалы, деректер түрін түрлендіру);
статистиканы, болжамды өрістерді және болжамды модельдердің өзін сипаттау.
PMML стандарты деректерді талдау алгоритмдері мен әдістерін, атап айтқанда нейрондық желілерді, шешім ағаштарын, ассоциативті ережелер алгоритмдерін, кластерлік талдауды, логикалық ережелерді және т. б. қолдана отырып жасалған ең көп таралған болжамды модельдерге қолдау көрсетеді.



  1. Download 0.76 Mb.

    Do'stlaringiz bilan baham:
1   ...   16   17   18   19   20   21   22   23   ...   30




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling