Qo’lda yozilgan raqamlar MNIST-Dataset
MNIST-bu qo'lda yozilgan raqamlarning keng qo'llaniladigan ma'lumotlar to'plami bo'lib, unda mashinani o'rganish modelini tayyorlash uchun 60000 ta qo'lda yozilgan raqam va modelni sinash uchun 10000 ta qo'lda yozilgan raqam mavjud. U 1998 yilda taqdim etilgan va tasniflash vazifalari uchun standart mezonga aylangan. U "Salom, dunyo" ma'lumotlar to'plami deb ham ataladi, chunki uni ishlatish juda oson. MNIST yanada kattaroq ma'lumotlar to'plamidan olingan NIST maxsus ma'lumotlar bazasi 19 unda nafaqat raqamlar, balki katta va kichik harflar ham mavjud qo'lda yozilgan harflar. MNIST ma’lumotlar to’plamida har bir raqam 28x28 pixel o’lchamdagi kulrang rangda saqlanadi. Quyida siz o'quv to'plamidan dastlabki 10 raqamni ko'rishingiz mumkin:
Bugungi kunda ma'lumotlar to'plami juda sodda deb hisoblanadi (masalan, qarang Yan Gudfelloning tviti) milliardlab parametrlarga ega zamonaviy, juda murakkab chuqur o'rganish modellarini sinab ko'rish uchun. Biroq, ma'lumotlar to'plami hali ham foydali. Masalan, algoritmlarning yangi bajarilishini tezda sinab ko'rish uchun foydalidir. Sinalgan model MNIST imkoniyat bo'yicha yuqori aniqlikka erishsa amalga oshirish to'g'ri bo'ladi. Agar algoritm MNISTDA ishlamasa, u umuman ishlamaydi. Ikkinchidan, MNIST, masalan, tasvirni tanib olish uchun mashinani o'rganishni qo'llashda birinchi qadamlarini bajaradigan mashinani o'rganishni boshlaganlar uchun juda mos keladi.
Ma'lumotlar to'plami mashinani o'rganish hamjamiyati tomonidan yigirma yildan ko'proq vaqt davomida keng o'rganilgan va internetda, kitoblarda va tadqiqot ishlarida ko'plab manbalarni topish mumkin. Hatto oddiy uch qatlamli neyron tarmog'i ham 98% dan ortiq aniqliklarga (ya'ni 2% dan kam xato) osonlikcha erishishi mumkin. Ushbu ma'lumotlar to'plami bilan o'ynash uchun oldindan ishlov berish talab qilinmaydi, chunki barcha raqamlar hajmi normallashtirilgan va rasmda markazlashtirilgan. Ma'lumotlar to'g'ridan-to'g'ri mashinani o'rganish modeliga kirish sifatida ishlatilishi mumkin. Tasvirlar kulrang rangdagi rasmlardir, shuning uchun yangi boshlanuvchilar bir nechta rang o'lchamlari bilan shug'ullanmasliklari kerak.
Do'stlaringiz bilan baham: |