Болжау (Forecasting). Тарихи деректердің ерекшеліктері негізінде болжау мәселесін шешу нәтижесінде мақсатты сандық көрсеткіштердің жетіспейтін немесе болашақ мәндері бағаланады. Мұндай тапсырмаларды шешу үшін математикалық статистика әдістері, нейрондық желілер және т. б. кеңінен қолданылады.
Визуализация (Visualization, Graph Mining). Визуализация нәтижесінде талданған деректердің графикалық бейнесі жасалады. Визуализация мәселесін шешу үшін деректерде заңдылықтардың болуын көрсететін графикалық әдістер қолданылады. Визуализация әдістерінің мысалы-деректерді 2-D және 3-D өлшемдерінде ұсыну.
Жіктеу мәселесін шешу әдістері
Жіктеу (Classification). Data Mining-тің ең қарапайым және кең таралған міндеті. Жіктеу мәселесін шешу нәтижесінде зерттелетін мәліметтер жиынтығы объектілерінің топтарын сипаттайтын белгілер - кластар анықталады; осы белгілер бойынша жаңа объектіні белгілі бір класқа жатқызуға болады.
Жіктеу мәселесін шешу үшін келесі әдістерді қолдануға болады: жақын көрші (Nearest Neighbor); k-жақын көрші (Knearest Neighbor); Байес желілері (Bayesian Networks); шешім ағаштарын индукциялау; нейрондық желілер (neural networks).
Жақын көршілердің әдісі k классификацияның сенімділігін арттыруға мүмкіндік береді. Талданатын объекті көршілердің негізгі массасы сияқты, яғни, x_i талдау үлгісіне жақын объектілерге ұқсас сыныпқа жатады. Екі сыныпқа байланысты мәселелерді шешкен кезде, көршілердің саны әртүрлі сыныптарға тиесілі болса, көршілер саны бірдей болмайды.
Байес желісін құру зерттелетін аймақ туралы нақты білімді қажет етеді. Егер білім тек оқыту негізінде қалыптасатын болса, онда нейрондық желілерді қолданған жөн. Байес желісін құрудың күрделілігі - бұл үшін сізге тым көп, кейде өте күрделі, ықтималдық кестелерін білу қажет. Сол сияқты, нейрондық желілерді құру үшін тек жаттығулар арқылы алынған көптеген салмақтар мен шектер туралы білу керек. Нейрондық желілерде бұрын алған білімді пайдалану мүмкін емес.
Do'stlaringiz bilan baham: |