Katta ma'lumotlarni qayta ishlash uchun mashinani o'rganish bo'yicha so'rov Kalit so'zlar


Download 91.52 Kb.
bet6/8
Sana24.03.2023
Hajmi91.52 Kb.
#1291354
1   2   3   4   5   6   7   8
Bog'liq
maqola Madina - копия

Logistika
Logistik kompaniyalar Internet of Things (IoT) dan katta ma'lumotlardan foydalanish bo'yicha katta tajribaga ega bo'lishi mumkin. UPS yuk mashinalari GPS, simsiz adapterlar va datchiklar bilan jihozlangan bo'lib, kompaniyaning bosh qarorgohi yuk mashinalarining joylashuvini kuzatishi va dvigatelning buzilishining oldini olishi mumkin. Hozircha ushbu texnologiya UPSga o'z xodimlarini nazorat qilish va boshqarishda, shuningdek yetkazib berish yo'nalishlarini optimallashtirishda yordam beradi. UPS yuk mashinalarining optimal yetkazib berish marshrutlari oldingi haydash tajribasiga qarab belgilanadi. UPS drayverlari 2011-yilda deyarli 48,28 million kilometr kam yurgan [ 21 ].
Tegishli ish
Mashinani o'rganish texnikasidan foydalangan holda katta ma'lumotlarni qayta ishlash bo'yicha tegishli tadqiqotlar ushbu bo'limda ko'rib chiqiladi.
Mashinani o'rganish (ML) va nano fanlar hamjamiyatlarini ulash uchun amalga oshirilgan o'zaro ta'sirlarning uchta turiga, shu jumladan katta nanologiya ma'lumotlar to'plamlarida ML dan foydalanishni tahlil qilish va ulardan yangi tushunchalarni olish uchun ko'rib chiqish tadqiqoti o'tkazildi . , MLni materialni tezlashtirish uchun qo'llash, masalan, eksperimental dizaynni boshqarish uchun faol o'rganishdan foydalanish va nihoyat, ML uchun moslashtirilgan apparatni amalga oshirish uchun xotira qurilmalarining nanofanidan foydalanish. Ular kelgusida nanofan-mashinalarni o‘rganish bo‘yicha hamkorlikdagi to‘siqlar va istiqbollarni muhokama qilish bilan yakunlandi.
Asosiy komponentlar tahlili (PCA) va chiziqli diskriminant tahlili (LDA) ikkita kashshof o'lchovni kamaytirish texnikasining to'rtta mashinani o'rganish algoritmiga (qaror daraxti induksiyasi, qo'llab-quvvatlash vektor mashinasi (SVM), Naive Bayes tasniflagichi va tasodifiy o'rmon tasniflagichi) ta'siri edi. Tajribalar shuni ko'rsatdiki, katta o'lchamli ma'lumotlar to'plamlari bilan ishlashda PCA-ga asoslangan mashinani o'rganish usullari LDA-dan ustundir. Ma'lumotlar to'plamining o'lchovliligi past bo'lsa, o'lchovni kamaytirmasdan ML texnikasi yaxshiroq natijalar berishi ko'rsatilgan. Bundan tashqari, o'lchamlarni kamaytirishdan foydalanmasdan, Decision Tree va Random Forest tasniflagichlari boshqa ikkita texnikadan, shuningdek, PCA va LDA dan oshib ketadi.
Mashinani o'rganish usullari ko'krak bezi saratonini genning klinik ko'rinishi va ekspressiyasining katta ma'lumotlaridan oldindan aniqlashni yaxshilaydi [ 26 ]. Gupta va boshqalar. da [ 26 ] ko'krak bezi saratoni sohasida ma'lumotlar tahliliy asoslari, asboblari, texnikasi va mashinani o'rganish usullarini qo'llash bo'yicha tadqiqot o'tkazdi, xususan, saratonning qaytalanishi, saratondan omon qolish, saratonni aniqlash va bashorat qilish sohalarida. Ular sun'iy neyron tarmog'i (ANN) va qo'llab-quvvatlash vektor mashinasi (SVM) ko'krak saratonini aniqlash uchun eng ko'p ishlatiladigan mashinani o'rganish usullaridan ikkitasi ekanligini aniqladilar. Apache Spark mashinani o'rganishning ko'plab ramkalari (ML) bilan ishlashi tasdiqlangan.
Katta ma'lumotlar ma'lumotlar to'plamiga asoslangan holda diabetning yaqinlashib kelayotgan xavfini bashorat qilishi va shunga mos ravishda davolanishni ta'minlashi mumkin. Saxena diabet bo'yicha mashinani o'rganish algoritmlari va xabardorlikni bashorat qilish modelini o'rganib chiqdi. Boshqa ML algoritmlari bilan solishtirganda, Random Forest (RF) va Support Vector Machine (SVM) algoritmlari bashorat qilishning yaxshi natijalarini beradi.
Сhuqur o'rganishga (DL) e'tibor qaratgan holda, atrof-muhit va suvni boshqarishda (EWM) katta ma'lumotlar va mashinani o'rganish (ML) ilovalari bo'yicha dalillarga asoslangan so'rovni taqdim etdilar . Ushbu so'rovning maqsadi EWM-da ma'lumotlarga asoslangan tadqiqotlarning potentsiali va afzalliklarini ko'rib chiqish, katta ma'lumotlar va mashinalarni o'rganish bo'yicha asosiy tushunchalar va usullarning qisqacha mazmunini taqdim etish, joriy ilovalarni tizimli ko'rib chiqish va nihoyat asosiy muammolarni muhokama qilish va muammolar, shuningdek, kelajakdagi tadqiqot yo'nalishlarini taklif qiladi.
CatBoost - bu GBDT oilasiga mansub mashinani o'rganish to'plami texnologiyasi. CatBoost 2018-yil oxirida ishga tushirilganidan buyon katta maʼlumotlardan foydalanadigan mashinani oʻrganish loyihalarida muvaffaqiyatli qoʻllanildi. Shu nuqtai nazardan, tadqiqotchilari CatBoost tadqiqotlarini katta maʼlumotlarga taalluqli boʻlishini koʻrib chiqdilar va CatBoost-ni koʻrsatadigan tadqiqotlardan eng yaxshi tajribalarni olishdi. boshqa texnologiyalardan, shuningdek, CatBoost-ning pastligini ko'rsatadigan texnologiyalardan ustun bo'ling. CatBoost shuningdek, kategorik va heterojen ma'lumotlarni talab qiladigan mashinani o'rganish ilovalari uchun juda mos keladi, chunki bu qarorlar daraxtiga asoslangan yondashuv.
Tadqiqotchilari qishloq xoʻjaligida katta maʼlumotlar va mashinani oʻrganishdan foydalanish boʻyicha maʼlumot taklif qildilar, muammolar va oʻzgarishlarni taʼkidladilar, bu tizimlar uchun arxitekturalarni yaratdilar va tizimli adabiyotlarni koʻrib chiqish (SLR) oʻtkazdilar, bu ularga 34 real-dunyo qishloq xoʻjaligi misollarini tekshirish imkonini berdi. Topilmalar shuni ko'rsatdiki, bulutli texnologiyalar tufayli katta hajmdagi ma'lumotlarni qayta ishlash endi muammo emas. Fermerlar odatda tushunmaydigan texnik ma'lumotlarni qo'llab-quvvatlovchi xom, yarim qayta ishlangan va qayta ishlangan (qiymat ma'lumotlari) va axborotni vizualizatsiya qilish tizimlarida ma'lumotlarning turli bosqichlarida nazorat qilinmaganligi sababli, ishlov berish tezligi qiyinligicha qolmoqda.
Ma'lumotnoma [ 8 ] aqlli bino sohasida katta ma'lumotlar tahlili va mashinani o'rganish texnikasining roliga qaratilgan. U mashinani o'rganish va katta ma'lumotlar ilovalari, xususan, aqlli xizmatlar va infratuzilmani rivojlantirish bo'yicha ilmiy maqolalarni batafsil ko'rib chiqdi.
Ko'pgina tadqiqotlar hisob-kitoblarga asoslangan eksperimentlarni o'tkazdi va tasvirlarni tasniflash muammosida ishlatiladigan ko'plab mashinani o'rganish algoritmlarini taqqoslashdi. Buning natijasi shundaki, chuqur konvolyutsion tarmoq eng yaxshi ko'rsatkichga ega. Logistic regression, multilayer perceptron va Stacked noising auto-koderlar bilan solishtirganda xatolik darajasi kamroq. GPUda ishlaydigan konvolyutsion neyron tarmog'i vaqtni sezilarli darajada qisqartirishni ta'minladi. Bu, shuningdek, konvolyutsiyalar bilan operatsiyalar uchun sozlangan NVidia ning cudnn kutubxonasi bilan bog'liq .
Chiziqli tezlatgich manbalarida individual terahertz impulslarining spektral shakli va vaqtinchalik kechikish to'g'ridan-to'g'ri mashinani o'rganish algoritmlari yordamida to'g'ri prognoz qilinishi mumkin. FPGA va GPU kabi heterojen protsessorlarda bu algoritmlar chuqur va maxsus sun'iy neyron tarmoqlarini (ANN) o'rgatish uchun katta hajmdagi ma'lumotlarni qayta ishlashi mumkin .
Katta astronomik ma'lumotlarga shoshilinch ehtiyoj tufayli mashinani o'rganish turli xil ma'lumotlar jarayonlarini, jumladan, ma'lumotlarni tasniflash, bashorat qilish va arxivlashni qondirish uchun keng qo'llanila boshlandi. Takroriy neyron tarmog'i (RNN) turli vaqt nuqtalari orasidagi o'zaro ta'sirlar va ulanishlarni aniqlash qobiliyati tufayli vaqt seriyalarini tahlil qilish uchun ayniqsa samarali ekanligi keng tarqalgan edi .
Katta ma'lumotlarni qayta ishlash texnikasi va mashinani o'rganish algoritmlarining qo'llanilishi tarmoqqa hujum va anomaliyalarni aniqlashdir. Ma'lumotnoma mashinani o'rganish algoritmlari va katta ma'lumotlarni qayta ishlash texnikasi aralashmasidan foydalangan holda tarmoqqa hujum va kiberxavfsizlik ma'lumotlar to'plamlaridagi anomaliyalarni aniqlash uchun yondashuvni taqdim etdi.

Download 91.52 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling