Metrik tasniflash
Metrik klassifikator (similarity-based classifier - o‘xshashlikka asoslangan tasniflagich) – ob'ektlar orasidagi o'xshashlik ballarini hisoblashga asoslangan tasniflash algoritmidir. Eng oddiy metrik klassifikator
eng yaqin qo'shnilar usuli bo'lib, unda tasniflanayotgan ob'ekt unga o'xshash ob'ektlarning ko'p qismini o'z ichiga olgan sinfga tegishlidir.
Metrik algoritmlarning xilma-xilligi
Metrik tasniflash algoritmlari quyidagilarni o'z ichiga oladi:
Eng yaqin qo'shni usuli
Potentsial funksiyalar usuli
Radial asosli funksiyalar usuli
Parzen oyna usuli
Standartlarni maydalash usuli
Baholarni hisoblash algoritmi
Metrik tasniflagichlarga qo'shimcha ravishda, mashinani o'rganishda ob'ektlarning o'xshashligi haqidagi ma'lumotlardan
foydalanadigan, ammo boshqa muammolarni hal qilish uchun ishlatiladigan keng usullar sinfi mavjud:
Klasterlash
Parametrik bo'lmagan regressiya
Ko'p o'lchovli masshtablash
Vizualizatsiya, xususan, Affinity xaritasi va Kohonen xaritasi
Kompaktlik gipotezasi
Metrik klassifikatorlar ixchamlik gipotezasiga asoslanadi, unga ko'ra o'xshash ob'ektlar har xil ob'ektlarga qaraganda bir xil sinfda ko'proq bo'ladi.
Bu shuni anglatadiki, sinflar orasidagi chegara ancha sodda shaklga ega va sinflar ob'ekt fazosida ixcham mahalliylashtirilgan hududlarni tashkil qiladi. E'tibor bering, matematik tahlilda chegaralangan yopiq to'plamlar ixcham deyiladi. Kompaktlik gipotezasi bu kontseptsiyaga hech qanday aloqasi yo'q va bu so'zning "kundalik" ma'nosida tushuniladi.
Xususiyatsiz tan olish
Metrik algoritmlarda tasniflanayotgan ob'ektni xususiyatlar to'plami bilan emas, balki to'g'ridan-to'g'ri o'quv namunasidagi boshqa ob'ektlarga masofalar vektori bilan tavsiflash mumkin. Bunday hollarda, xususiyatsiz tan olinishi haqida ham gapiriladi.
Masalan, matnlarning o'xshashligi, kimyoviy formulalar, aminokislotalar ketma-ketligi va boshqalar. xususiyat tavsiflariga o'tishdan ko'ra, to'g'ridan-to'g'ri o'lchash ancha oson.