Bundan tashqari O‘zbekiston Respublikasi Prezidenti Islom Karimovning
Download 2.16 Mb.
|
BMI Irodaga
Almashinuvchan transformator usuli bilan tanishtirish - Imo-ishorani aniqlash vazifasi uzoq masofali bog'liqliklarni modellashtirishni talab qiladi. YOLOv5s magistral tarmog'i tasvirning mahalliy ma'lumotlarini olish uchun ko'plab konvolyutsion qatlamlardan foydalanadi va konvolyutsion qatlamlar to'plami xususiyatlarni olishda magistral tarmoqning ish faoliyatini yaxshilaydi, balki model parametrlari sonini oshiradi va modelning xulosa chiqarish tezligini pasaytiradi. Ushbu ishda biz YOLOv5s magistral tarmog'ini optimallashtirish uchun darboğazli transformator usulini taqdim etamiz. BotNet qog'ozidagi tajribalarga ko'ra, qoldiq konvolyutsion neyron tarmog'ining konvolyutsiya operatorini ko'p boshli o'z-o'ziga diqqatli operator bilan almashtirish modelni tanib olish aniqligini yaxshilash va model parametrlari sonini kamaytirishi mumkin. Biz ushbu yondashuvga murojaat qilamiz va YOLOv5 magistralidagi C3 modulini C3BOT moduliga yaxshilaymiz. Shu bilan birga, kompyuterning o'ziga e'tibor berish talabini hisobga olgan holda, barcha C3 modullarini C3BOT modullari bilan almashtirish katta o'quv vaqtini sarflaydi, shuning uchun faqat magistralning oxirgi qatlami almashtiriladi. Multi-Head Self-Attention (MSHA) pozitsiyani kodlashni fazoviy diqqat sifatida ko'rib chiqadi, gorizontal va vertikal o'lchamlarda fazoviy diqqat sifatida qaraladigan ikkita o'rganiladigan vektorni o'z ichiga oladi, so'ngra kontent-pozitsiyani olish uchun q dagi yig'ilgan va birlashtirilgan fazoviy vektorlarni ko'paytiradi. Bundan tashqari, 5-rasmda MSHA tuzilishi ko'rsatilgan. Darboğaz transformator modulidagi MHSA qatlami bilan global o'z-o'zini e'tiborlilik konvolyutsiya tomonidan olingan xususiyat xaritalarida mavjud bo'lgan ma'lumotlarni qayta ishlash va jamlash uchun ishlatiladi, bu model parametrlarini pasaytiradi, stacking natijasida paydo bo'lgan modelning shishishidan qochadi. konvolyutsion neyron tarmog'i parametrlari va xulosa chiqarish tezligiga asoslangan aniqlikni ma'lum darajada oshiradi. Shu bilan birga, magistral tarmoqning o'rta xususiyatlarini ajratib olish qatlamidan (oltinchi qatlam) so'ng, o'rta va katta maqsadlar uchun tarmoqning xususiyatlarni birlashtirish qobiliyatini kuchaytirish uchun o'tish-qo'shimcha qatlam qo'shiladi. C3BOT modulining tuzilishi va optimallashtirilgan umumiy tarmoq strukturasi 6-rasmda ko'rsatilgan .
2.8-rasm. Optimallashtirilgan MHSA tuzilishi. 2.9-rasm. Optimallashtirilgan YOLOv5 larning C3BOT moduli va umumiy tarmoq tuzilishi. Eksperimental muhit va ma'lumotlar to'plami Ushbu ishdagi tajribalar uchun ishlatiladigan operatsion tizim Windows 10. CPU modeli - AMD Ryzen 5 2600X olti yadroli protsessor @3,6 GHz, ishlaydigan xotira 16 GB, GPU modeli - NVIDIA GeForce RTX 2060, video xotira hajmi 6 GB, xotira hajmi esa 14 G. Pytorch chuqur o'rganish tizimidan foydalaning, 1.8.0 versiyasini bosing. Eksperimental dasturlash tili sifatida Python 3.8 dan, grafik tezlashtirish uchun CUDA 11.1.102 va CUDNN 8.0.5 dan foydalanilgan. Tajribaning asl tasvir ma'lumotlari imo-ishora ma'lumotlari to'plamidan olingan, jumladan 285 ta imo-ishora rasmlari va barcha tasvirlar qo'lda etiketlanadi. Ma'lumotlar to'plamining xilma-xilligi va murakkabligini oshirish uchun tanlangan imo-ishora rasmlari turli burchaklardan olingan turli imo-ishora rasmlarini o'z ichiga oladi, ular 4 toifali, ya'ni "kim", "nima", "yetar" va "iltimos"; har bir toifa tasodifiy ravishda 8:1:1 nisbatida o'quv to'plamiga, test to'plamiga va tekshirish to'plamiga bo'linadi va LabelImg tasvirlarga izoh berish uchun ishlatiladi. Yorliqlash ma'lumotlari fayli matn formatida, shu jumladan imo-ishoralar toifasi ma'lumotlari va yer-haqiqat chegarasi qutisining koordinatalari ma'lumotlari va etiketli tasvirlar quyidagilarda ko'rsatilgan.7-rasm . 2.10-rasm. Imo-ishoralar ma'lumotlar to'plami. Qayta chaqirishni ( r ) abscissa va aniqlikni ( p ) ordinata sifatida oling, keyin egri chiziq chizing. Ushbu egri chiziq, abscissa va ordinata o'qlari bilan o'ralgan maydon AP qiymati hisoblanadi va nihoyat, o'rtacha arifmetik hisoblanadi. Hisoblash natijasi mAP qiymati bo'lib, maxsus hisoblash usuli quyidagicha. Imo-ishoralarni aniqlash natijalarini yaxshilashda yuqoridagi usulning samaradorligini tekshirish uchun modullar qo‘shilgan holda ablasyon tajribalari o‘tkazildi. Asosiy model sifatida YOLOv5s bilan tajribalar natijasida olingan natijalar BASE sifatida qayd etildi, ASFF modulini bazaviy modelga qo'shishdan olingan natijalar AF sifatida qayd etildi va CARAFE modulini almashtirish natijasida olingan natijalar CA sifatida qayd etildi, natija C3 dan C3Bot moduliga takomillashtirish orqali olingan BoT sifatida qayd etildi. Asosiy model va uchta takomillashtirilgan model 1200 davr uchun turli xil o'qitish parametrlarini izchil o'rnatish sharti bilan o'qitildi. Eksperimental natijalar 8-rasmda ko'rsatilgan . 2.11-rasm. O’qitish natijalari. Buni 2.11-rasmdan ko'rish mumkin model mashg'ulot boshida dastlabki 2/3 o'quv sikllarida tezroq yaqinlashadi va oxirgi 1/3 o'quv tsikllarida konvergentsiya tezligi sekinroq bo'ladi. ASFF modulini qo'shgandan so'ng, model tezroq birlashadi va yo'qotish taxminan 425 davrda birinchi marta 0,02 ga tushadi, bu asosiy modeldan taxminan 150 epox tezroq. O'rtacha aniqlik dastlabki 1/3 mashg'ulot davrida sezilarli darajada oshmaydi va oxirgi 2/3 mashg'ulot davridagi asosiy modeldan taxminan 1,1% yuqori. Shu asosda, eng yaqin qo'shni yuqori namunani CARAFE bilan almashtirgandan so'ng, treningning ikkinchi yarmida modelning yaqinlashuv tezligi yaxshilanadi va yo'qotish birinchi marta taxminan 470 epoxda 0,02 ga tushadi, bu taxminan 100 davrni tashkil etadi. asosiy modeldan tezroq. mAP qiymati 175 davrdan keyin asosiy modeldan yaxshiroq, bu faqat ASFF qo'shilgan modeldan taxminan 1,8% yuqori. Nihoyat, C3 modulini C3BOT moduliga takomillashtirishdan so'ng, modelning konvergentsiya tezligi va MAP qiymatlari asosan birinchi 2/3 ta'lim davrida AF + CAmodel bilan bir xil bo'ladi; oxirgi 1/3 ta'lim davrida modelning mAP qiymati asta-sekin AF + CA modelidan oshib ketadi. 2.12-rasm. To'rtta o‘qitish egri chizig'i. (a) precision; (b) recall; (c) train-location-loss; (d) validation-location-loss. 2.13-rasm. Qisman aniqlash natijalarini taqqoslash. Download 2.16 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling