Mana biz nimani qamrab oladigan narsalarni ko'rib chiqamiz


Download 125.31 Kb.
Sana18.06.2023
Hajmi125.31 Kb.
#1586322
Bog'liq
Object


Ob'ektni aniqlash - bu tasvir yoki videodagi ob'ektlarni aniqlash va joylashtirish imkonini beruvchi kompyuter ko'rish texnikasi. Bunday identifikatsiya va lokalizatsiya yordamida ob'ektni aniqlash sahnadagi ob'ektlarni sanash va ularning aniq joylashuvini aniqlash va kuzatish, shu bilan birga ularni aniq belgilash uchun ishlatilishi mumkin.

Ushbu qo'llanmada siz ushbu savollarning barchasiga va boshqalarga javob topasiz. Siz amalga oshirishni ko'rib chiqayotgan tajribali mashinani o'rganish muhandisi bo'lasizmi, ko'proq o'rganmoqchi bo'lgan dasturchi yoki kompyuterni ko'rish va ob'ektlarni aniqlash bilan nima mumkinligini o'rganmoqchi bo'lgan mahsulot menejeri bo'lasizmi, ushbu qo'llanma siz uchun.
Lekin ob'ektni aniqlash aslida qanday ishlaydi? Turli xil yondashuvlar qanday, uning potentsial afzalliklari va cheklovlari qanday va uni biznesingizda qanday ishlatishingiz mumkin?
Mana biz nimani qamrab oladigan narsalarni ko'rib chiqamiz:

1-qism: Ob'ektni aniqlash - asoslar


Ob'ektni aniqlash nima?
Ob'ektni aniqlash usullari va turlari
Ob'ektni aniqlash nima uchun muhim?
2-qism: Ob'ektni aniqlash qanday ishlaydi?
Kirish va chiqishlar
Asosiy tuzilma
Model arxitekturasining umumiy ko'rinishi
Ob'ektni aniqlash chekkada qanday ishlaydi
3-qism: Foydalanish holatlari va ilovalar
Video kuzatuv
Olomonni hisoblash
Anomaliyalarni aniqlash
O'z-o'zidan boshqariladigan avtomobillar
4-qism: Resurslar
Ishni boshlash
Darsliklar
Adabiyot manbalarini haqida umumiy ma'lumot; Adabiyot sharhi
Maʼlumotlar toʻplami mavjud
.
1-qism: Ob'ektni aniqlash - asoslar
Ob'ektni aniqlash nima?
Ob'ektni aniqlash - bu tasvir yoki videodagi ob'ektlarni aniqlash va joylashtirish uchun ishlaydigan kompyuter ko'rish usuli. Xususan, ob'ektni aniqlash ushbu aniqlangan ob'ektlar atrofida chegara qutilarini chizadi, bu bizga aytilgan ob'ektlar ma'lum bir sahnada qayerda joylashganligini (yoki ular qanday harakatlanishini) aniqlashga imkon beradi.

Ob'ektni aniqlash odatda tasvirni aniqlash bilan chalkashib ketadi, shuning uchun davom etishdan oldin ular orasidagi farqlarni aniqlab olishimiz kerak.


Tasvirni aniqlash tasvirga yorliq tayinlaydi. Itning surati "it" yorlig'ini oladi. Ikki itning surati hali ham "it" yorlig'ini oladi. Ob'ektni aniqlash, aksincha, har bir itning atrofida bir quti chizadi va qutiga "it" belgisini qo'yadi. Model har bir ob'ektning qaerdaligini va qanday yorliq qo'llanilishi kerakligini taxmin qiladi. Shunday qilib, ob'ektni aniqlash tanib olishdan ko'ra tasvir haqida ko'proq ma'lumot beradi.


Mana bu farq amalda qanday ko'rinishiga misol:





Ob'ektni aniqlash usullari va turlari
Umuman olganda, ob'ektni aniqlashni mashinani o'rganishga asoslangan yondashuvlar va chuqur o'rganishga asoslangan yondashuvlarga bo'lish mumkin.
Ko'proq an'anaviy ML-ga asoslangan yondashuvlarda kompyuterni ko'rish texnikasi ob'ektga tegishli bo'lishi mumkin bo'lgan piksellar guruhlarini aniqlash uchun rang gistogrammasi yoki qirralari kabi tasvirning turli xususiyatlarini ko'rib chiqish uchun ishlatiladi. Keyinchalik bu xususiyatlar ob'ektning joylashishini uning yorlig'i bilan bashorat qiladigan regressiya modeliga kiritiladi.
Boshqa tomondan, chuqur o'rganishga asoslangan yondashuvlar konvolyutsion neyron tarmoqlardan (CNN) uchdan-uchgacha, nazoratsiz ob'ektni aniqlashni amalga oshiradi, bunda xususiyatlarni alohida aniqlash va ajratib olish kerak emas. CNN-ga yumshoq kirish uchun ushbu sharhni ko'rib chiqing.
Chuqur o'rganish usullari ob'ektni aniqlashning zamonaviy yondashuvlariga aylanganligi sababli, biz ushbu qo'llanma maqsadlari uchun asosiy e'tiborni qaratadigan usullardir.
Ob'ektni aniqlash nima uchun muhim?
Ob'ektni aniqlash boshqa shunga o'xshash kompyuter ko'rish texnikasi bilan uzviy bog'liqdir, masalan, tasvirni aniqlash va tasvirni segmentatsiyalash, bu bizga tasvirlar yoki videolardagi sahnalarni tushunish va tahlil qilishda yordam beradi.

Ammo muhim farqlar mavjud. Rasmni aniqlash faqat aniqlangan ob'ekt uchun sinf yorlig'ini chiqaradi va tasvirni segmentatsiyalash sahna elementlarini piksel darajasida tushunishni yaratadi. Ob'ektni aniqlashni boshqa vazifalardan ajratib turadigan narsa uning tasvir yoki video ichidagi ob'ektlarni joylashtirishning noyob qobiliyatidir. Bu bizga ushbu ob'ektlarni sanash va keyin kuzatish imkonini beradi.


Ushbu asosiy farqlarni va ob'ektni aniqlashning noyob imkoniyatlarini hisobga olgan holda, biz uni qanday qilib bir necha usullarda qo'llash mumkinligini ko'rishimiz mumkin:


Olomonni hisoblash


O'z-o'zidan boshqariladigan avtomobillar
Video kuzatuv
Yuzni aniqlash
Anomaliyalarni aniqlash
Albatta, bu to'liq ro'yxat emas, lekin u ob'ektni aniqlash bizning kelajagimizni shakllantirishning asosiy usullarini o'z ichiga oladi.

2-qism: Ob'ektni aniqlash qanday ishlaydi?


Endi biz ob'ektni aniqlash nima ekanligini, ob'ektni aniqlashning har xil turlari o'rtasidagi farqlarni va undan nima uchun foydalanish mumkinligini bilganimizdan so'ng, keling, uning qanday ishlashini chuqurroq o'rganamiz.

Ushbu bo'limda biz ob'ektni aniqlashning bir nechta chuqur o'rganishga asoslangan yondashuvlarini ko'rib chiqamiz va ularning afzalliklari va cheklovlarini baholaymiz. Eslatib oʻtamiz, ushbu umumiy koʻrinishda biz obʼyektlarni aniqlashning eng zamonaviy usullariga aylangan neyron tarmoqlardan foydalanadigan yondashuvlarni koʻrib chiqamiz. Ushbu boʻlimda biz koʻrib chiqamiz. ob'ektni aniqlash va ularning afzalliklari va cheklovlarini baholash uchun bir nechta chuqur o'rganishga asoslangan yondashuvlarda. Eslatib oʻtamiz, ushbu umumiy koʻrinishda biz obʼyektlarni aniqlashning eng zamonaviy usullariga aylangan neyron tarmoqlardan foydalanadigan yondashuvlarni koʻrib chiqamiz.


Asosiy tuzilma


Chuqur o'rganishga asoslangan ob'ektni aniqlash modellari odatda ikki qismdan iborat. Kodlovchi tasvirni kirish sifatida qabul qiladi va uni bir qator bloklar va qatlamlar orqali boshqaradi, ular ob'ektlarni joylashtirish va belgilash uchun ishlatiladigan statistik xususiyatlarni ajratib olishni o'rganadi. Kodlovchidan olingan ma'lumotlar dekoderga o'tkaziladi, u har bir ob'ekt uchun chegara qutilari va teglarni bashorat qiladi.

Eng oddiy dekoder sof regressordir. Regressor enkoderning chiqishiga ulanadi va har bir cheklovchi qutining joylashuvi va hajmini to'g'ridan-to'g'ri taxmin qiladi. Modelning chiqishi ob'ekt uchun X, Y koordinata juftligi va uning tasvirdagi darajasidir. Oddiy bo'lsa-da, bu turdagi model cheklangan. Oldindan qutilar sonini belgilashingiz kerak. Agar sizning rasmingizda ikkita it bo'lsa, lekin sizning modelingiz faqat bitta ob'ektni aniqlash uchun mo'ljallangan bo'lsa, ulardan biri yorliqsiz qoladi. Biroq, agar siz har bir tasvirda oldindan bashorat qilishingiz kerak bo'lgan ob'ektlar sonini bilsangiz, sof regressorga asoslangan modellar yaxshi variant bo'lishi mumkin.


Regressor yondashuvining kengaytmasi mintaqaviy takliflar tarmog'idir. Ushbu dekoderda model ob'ekt yashashi mumkinligiga ishonadigan tasvirning hududlarini taklif qiladi. Keyin ushbu hududlarga tegishli piksellar yorliqni aniqlash (yoki taklifni rad etish) uchun tasniflash quyi tarmog'iga kiritiladi. Keyin ushbu hududlarni o'z ichiga olgan piksellarni tasniflash tarmog'i orqali boshqaradi. Ushbu usulning afzalligi aniqroq, moslashuvchan model bo'lib, u chegaralovchi qutini o'z ichiga olishi mumkin bo'lgan hududlarning ixtiyoriy sonini taklif qilishi mumkin. Qo'shimcha aniqlik, ammo hisoblash samaradorligi narxiga to'g'ri keladi.



Yagona tortishish detektorlari (SSD) o'rta joyni qidiradi. Mintaqalarni taklif qilish uchun quyi tarmoqdan foydalanish o'rniga, SSD-lar oldindan belgilangan hududlar to'plamiga tayanadi. Kirish tasviri ustiga bog'lash nuqtalari panjarasi yotqizilgan va har bir biriktiruvchi nuqtada bir nechta shakl va o'lchamdagi qutilar mintaqa sifatida xizmat qiladi. Har bir langar nuqtasidagi har bir quti uchun model mintaqada ob'ekt mavjudligi yoki yo'qligi haqida bashorat qiladi va uni ob'ektga yaqinroq moslashtirish uchun qutining joylashuvi va o'lchamiga o'zgartirishlar kiritadi. Har bir langar nuqtasida bir nechta qutilar mavjudligi va langar nuqtalari bir-biriga yaqin bo'lishi mumkinligi sababli, SSD'lar bir-biriga mos keladigan ko'plab potentsiallarni aniqlaydi. Ushbu bashoratlarning ko'pini yo'q qilish va eng yaxshisini tanlash uchun SSD chiqishiga keyingi ishlov berish qo'llanilishi kerak. Eng mashhur post-qayta ishlash texnikasi maksimal bo'lmagan bostirish deb nomlanadi.

Nihoyat, aniqlik haqida eslatma. Ob'ekt detektorlari har bir ob'ekt uchun joylashuv va yorliqni chiqaradi, ammo model qanchalik yaxshi ishlashini qanday bilamiz? Ob'ektning joylashuvi uchun eng ko'p qo'llaniladigan ko'rsatkich - kesishuv ustidan birlashma (IOU). Ikkita chegaralovchi quti berilgan, biz kesishish maydonini hisoblaymiz va birlashma maydoniga bo'linadi. Bu qiymat 0 dan (o'zaro ta'sir o'tkazilmaydi) 1 gacha (mukammal bir-biriga mos keladi). Yorliqlar uchun oddiy "foiz to'g'ri" dan foydalanish mumkin.

Model arxitekturasining umumiy ko'rinishi


R-CNN, Faster R-CNN, Mask R-CNN
Bir qator mashhur ob'ektlarni aniqlash modellari R-CNN oilasiga tegishli. Mintaqaviy konvolyutsion neyron tarmog'i uchun qisqacha, bu arxitekturalar yuqorida muhokama qilingan mintaqaviy taklif tuzilishiga asoslanadi. Yillar davomida ular yanada aniqroq va hisoblashda samaraliroq bo'ldi. Mask R-CNN - bu Facebook tadqiqotchilari tomonidan ishlab chiqilgan so'nggi iteratsiya bo'lib, u server tomonidagi obyektlarni aniqlash modellari uchun yaxshi boshlanish nuqtasi bo'ladi.

YOLO, MobileNet + SSD, SqueezeDet


Yagona tortishish detektorlari oilasiga tegishli bo'lgan bir qator modellar ham mavjud. Ushbu variantlar orasidagi asosiy farq ularning kodlovchilari va oldindan belgilangan langarlarning o'ziga xos konfiguratsiyasidir. MobileNet + SSD modellarida MobileNet-ga asoslangan kodlovchi mavjud, SqueezeDet SqueezeNet kodlovchisini oladi va YOLO modeli o'zining konvolyutsion arxitekturasiga ega. SSD'lar mobil yoki o'rnatilgan qurilmalar uchun mo'ljallangan modellar uchun ajoyib tanlovdir.

CenterNet


Yaqinda tadqiqotchilar ob'ektlarni aniqlash modellarini ishlab chiqdilar, bu esa mintaqaviy takliflarga bo'lgan ehtiyojni butunlay yo'q qiladi. CenterNet ob'ekt markazining X, Y koordinatalarini va uning hajmini (balandlik va kenglik) bashorat qilib, ob'ektlarga yagona nuqta sifatida qaraydi. Ushbu uslub SSD yoki R-CNN yondashuvlariga qaraganda samaraliroq va aniqroq ekanligini isbotladi.
Ob'ektni aniqlash chekkada qanday ishlaydi
Agar sizning foydalanish holatingiz ob'ektni aniqlash real vaqtda, internetga ulanmasdan yoki shaxsiy ma'lumotlarda ishlashini talab qilsa, siz ob'ektni aniqlash modelingizni to'g'ridan-to'g'ri mobil telefon yoki IoT platasi kabi chekka qurilmada ishga tushirish haqida o'ylayotgan bo'lishingiz mumkin.

Bunday hollarda, kam quvvatli qurilmalarda hamma narsa muammosiz ishlashiga ishonch hosil qilish uchun muayyan model arxitekturasini tanlashingiz kerak bo'ladi. Modellaringiz chekka o'rnatishga tayyor bo'lishini ta'minlash uchun bir nechta maslahatlar va fokuslar:


Tarmog'ingizni kamroq konvolyutsiya bloklarini o'z ichiga olishi uchun qisqartiring. Aksariyat hujjatlar hisoblash yoki xotira resurslari bilan cheklanmagan tarmoq arxitekturasidan foydalanadi. Bu qabul qilinadigan bashoratlarni yaratish uchun talab qilinganidan ko'ra ko'proq qatlam va parametrlarga ega bo'lgan tarmoqlarga olib keladi.


Modelingizga kenglik multiplikatorini qo'shing, shunda siz tarmoqdagi parametrlar sonini hisoblash va xotira cheklovlaringizga moslashtirishingiz mumkin. Konvolyutsiya qatlamidagi filtrlar soni, masalan, modelingizning umumiy hajmiga katta ta'sir qiladi. Ko'pgina qog'ozlar va ochiq kodli ilovalar bu raqamni qat'iy belgilangan konstanta sifatida ko'rib chiqadi, ammo bu modellarning aksariyati hech qachon mobil foydalanish uchun mo'ljallanmagan. Filtrlarning asosiy sonini doimiy kasrga ko'paytiruvchi parametrni qo'shish sizning qurilmangiz cheklovlariga mos keladigan model arxitekturasini modulyatsiya qilish imkonini beradi. Ba'zi vazifalar uchun siz katta hajmdagi kabi bajaradigan juda kichikroq tarmoqlarni yaratishingiz mumkin.
Modellarni kvantlash bilan qisqartiring, ammo aniqlik tushishidan ehtiyot bo'ling. Model og'irliklarini kvantlash ko'p joyni tejashga yordam beradi, ko'pincha model hajmini 4 yoki undan ko'p marta kamaytiradi. Biroq, aniqlik zarar ko'radi. Kvantlashtirilgan modellar sizning ehtiyojlaringizga javob beradimi yoki yo'qligini aniqlash uchun ularni qat'iy sinovdan o'tkazganingizga ishonch hosil qiling.
Kirish va chiqish o'lchamlari siz o'ylagandan kichikroq bo'lishi mumkin! Agar siz fotosuratlarni tashkil qilish dasturini ishlab chiqayotgan bo'lsangiz, ob'ektni aniqlash modelingiz kirish sifatida to'liq o'lchamdagi fotosuratlarni qabul qila olishi kerak deb o'ylash jozibali. Ko'pgina hollarda, chekka qurilmalar buni hal qilish uchun deyarli etarli ishlov berish kuchiga ega bo'lmaydi. Buning o'rniga, oddiy ruxsatda ob'ektni aniqlash modellarini o'rgatish, so'ngra ish vaqtida kirish tasvirlarini pasaytirish odatiy holdir.
Ushbu tarmoqlarni qanchalik kichik qilib yaxshi natijalarga erishishingiz mumkinligini ko'rish uchun mobil qurilmalar uchun kichik ob'ektlarni aniqlash modelini yaratish bo'yicha ushbu postni ko'rib chiqing.

3-qism: Foydalanish holatlari va ilovalar


Ushbu bo'limda biz ob'ektni aniqlash uchun haqiqiy foydalanish holatlari haqida umumiy ma'lumot beramiz. Biz ularning bir nechtasini oldingi bo'limlarda aytib o'tgan edik, ammo bu erda biz biroz chuqurroq sho'ng'iymiz va kompyuterni ko'rishning ushbu texnikasi barcha sohalarga ta'sirini o'rganamiz.

Xususan, biz ob'ektni aniqlashdan quyidagi sohalarda qanday foydalanish mumkinligini ko'rib chiqamiz:


Video kuzatuv


Olomonni hisoblash
Anomaliyalarni aniqlash (masalan, qishloq xo'jaligi, sog'liqni saqlash kabi sohalarda)
O'z-o'zidan boshqariladigan avtomobillar

Video kuzatuv


Ob'ektni aniqlashning zamonaviy usullari sahnadagi berilgan ob'ektning bir nechta nusxalarini aniq aniqlashi va kuzatishi mumkinligi sababli, bu usullar tabiiy ravishda video kuzatuv tizimlarini avtomatlashtirishga yordam beradi.

Masalan, ob'ektni aniqlash modellari bir vaqtning o'zida bir nechta odamlarni real vaqt rejimida, ular ma'lum bir sahna yoki video ramkalar bo'ylab harakatlanayotganda kuzatishga qodir. Chakana savdo do'konlaridan tortib sanoat zavodlari qavatlarigacha, bunday donador kuzatuv xavfsizlik, ishchilarning ishlashi va xavfsizligi, chakana piyodalar harakati va boshqalar haqida bebaho tushunchalarni berishi mumkin.


Olomonni hisoblash


Olomonni hisoblash ob'ektni aniqlashning yana bir qimmatli qo'llanilishidir. Mavzu bogʻlari, savdo markazlari va shahar maydonlari kabi aholi zich joylashgan hududlarda obʼyektlarni aniqlash korxonalar va munitsipalitetlarga piyoda, transportda yoki boshqa yoʻl bilan harakatlanishning turli turlarini samaraliroq oʻlchashda yordam beradi.

Odamlarni turli joylarda manevr qilishda mahalliylashtirish va kuzatish qobiliyati korxonalarga logistika quvurlari va inventarlarni boshqarishdan tortib, ish soatlarini saqlash, o'tish jadvali va boshqalarni optimallashtirishga yordam beradi. Xuddi shunday, ob'ektni aniqlash shaharlarga voqealarni rejalashtirishga, munitsipal resurslarni ajratishga va hokazolarga yordam berishi mumkin.


Anomaliyalarni aniqlash


Anomaliyalarni aniqlash - bu aniq sanoat misollari orqali eng yaxshi tushuntirilgan ob'ektni aniqlashdan foydalanish holati.

Misol uchun, qishloq xo'jaligida ob'ektni aniqlashning moslashtirilgan modeli o'simlik kasalliklarining potentsial holatlarini aniq aniqlashi va topishi mumkin, bu fermerlarga o'z hosiliga tahdidlarni aniqlashga imkon beradi, aks holda yalang'och inson ko'ziga sezilmaydi.


Sog'liqni saqlash sohasida esa ob'ektni aniqlash o'ziga xos va noyob simptomatik lezyonlarga ega bo'lgan sharoitlarni davolashda yordam berish uchun ishlatilishi mumkin. Bunday misollardan biri terini parvarish qilish va akne davolash shaklida keladi - ob'ektni aniqlash modeli bir necha soniya ichida akne holatlarini topishi va aniqlashi mumkin.


Ushbu potentsial foydalanish holatlarida ayniqsa muhim va jozibali narsa, ular odatda faqat qishloq xo'jaligi mutaxassislari yoki shifokorlar uchun mavjud bo'lgan bilim va ma'lumotlarni qanday ishlatishi va taqdim etishidir.


O'z-o'zidan boshqariladigan avtomobillar


Haqiqiy vaqtda avtomobilni aniqlash modellari avtonom avtomobil tizimlari muvaffaqiyatining kalitidir. Ushbu tizimlar dunyo bo'ylab xavfsiz va samarali harakat qilish uchun atrofdagi ob'ektlarni aniqlash, joylashtirish va kuzatish imkoniyatiga ega bo'lishi kerak.

Rasmlarni segmentatsiyalash kabi vazifalar avtonom transport vositalariga qo'llanilishi (va tez-tez qo'llanilishi) mumkin bo'lsa-da, ob'ektlarni aniqlash o'z-o'zidan boshqariladigan avtomobillarni haqiqatga aylantirish bo'yicha joriy ishlarni asoslovchi asosiy vazifa bo'lib qolmoqda.




https://www.fritz.ai/object-detection/
Download 125.31 Kb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling