Muhammad Al-Xorazmiy Nomidagi Toshkent Axborot Texnoligiyalari Universiteti Mustaqil ish Mavzu: Zamonaviy protsessorlarda vector ko’rsatmalaridan foydalanishni o’rganing. Bajardi: Nurmamatov Asliddin Tekshirdi


SIMD energiya va maydon samaradorligi


Download 100.9 Kb.
bet2/6
Sana11.05.2023
Hajmi100.9 Kb.
#1454504
1   2   3   4   5   6
Bog'liq
k a

SIMD energiya va maydon samaradorligi nuqtai nazaridan ma'lumotlarga parallel kodli hududlarni samarali boshqarish uchun ma'lumotlar darajasidagi parallelizmdan (DLP) foydalanadi . Biroq, dasturlash qobiliyati pastligi va xotiraga kirishning moslashuvchan emasligi sababli, SIMD birliklari ko'pincha to'liq foydalanilmaydi yoki umuman ishlatilmaydi. Ushbu muammoni hal qilish uchun ko'plab texnikalar taklif qilingan. Xotiraga kirish cheklovlarini oldini olish va ajralish muammolarini boshqarish uchun Intel SSE, AVX va ARM NEON ko'p tomonlama ma'lumotlar yo'llarini tanlab yoqish va o'chirish mumkin bo'lgan yo'laklarni maskalash ko'rsatmalarini qo'llab-quvvatlaydi. An'anaviy SIMD tuzilmasining kengaytirilgan versiyasi sifatida NVIDIA filiallar farqini yanada samarali qo'llab-quvvatlash uchun SIMT Bundan tashqari, Maven , Hwachaning oldingi versiyasi , an'anaviy vektor tuzilmalari va GPUlar o'rtasida gibrid arxitektura sifatida taklif qilingan.
Qisqacha muhokama qilinganidek, zamonaviy vektor birliklaridagi operatsion birliklarni alohida boshqarish mumkin. Misol uchun, Intel AVX, pastki so'z darajasidagi SIMD tuzilmasi maskalash orqali bajarish uchun birliklarni tanlashi mumkin va vektor-ip (VT) arxitekturasi Maven har bir blokni nafaqat maskalash, balki apparat vektor uzunligini aniqlash orqali alohida boshqarishi mumkin. ish vaqtida. VT-ga asoslangan dizayn o'zgarishlari, masalan, Maven, vektorni bajarish birligidagi mikro-iplarni boshqaradigan nazorat ipiga ega. Tekshirish ipi ma'lumotlarni samarali ko'chirish uchun vektor yukidan foydalanadi va ko'rsatmalarni saqlaydi va keyin barcha mikro-iplarni bir vaqtning o'zida boshqarish uchun vektor olish ko'rsatmalaridan foydalanadi.

Hwacha: asosiy vektor arxitekturasi

Hwacha - bu Rocket maxsus protsessor (RoCC) interfeysi bilan RISC-V Rocket protsessoriga biriktirilgan vektor tezlatgich . Hwacha va an'anaviy vektor yig'ish dasturlash modeli o'rtasidagi asosiy farq shundaki, Hwacha ustida vektor operatsiyalari xost protsessoridan olinmaydi; o'rniga ular Hwacha tezlatgichi tomonidan alohida ishchi ip shaklida olinadi. Shuning uchun, asosiy protsessor Hwacha-ni haqiqiy ko'rsatmalarni bajarmasdan nazorat tishlari yordamida boshqarishi kerak . RoCC - bu soprotsessor yordamida Raket yadrosini tezlashtirish uchun mo'ljallangan interfeys va interfeys yadro va biriktirilgan tezlatgich o'rtasida aloqa o'rnatishga imkon beradi. RoCC interfeysi bilan protsessor-soprotsessor ajratilgan strukturadan foydalanish va keyin muhokama qilinganidek vektor ko'rsatmalarini nazorat ipidan ajratish orqali Hwacha protsessorning asosiy ipiga parallel ravishda alohida ishchi ipni bajarishi mumkin.


1-rasm a da ko'rsatilganidek , Rocket besh bosqichli tartibli protsessorlari va Hwacha RoCC interfeysi orqali ulanadi va ularning xotira ma'lumotlarini L2 keshi yordamida almashish mumkin. 1 b-rasmda ko'rsatilganidek , protsessor oddiy Hwacha boshqaruv iplarini, Hwacha esa mos keladigan ishchi iplarni bajaradi. CPU tomonidagi Hwacha-ga xos ko'rsatmalar (boshqaruv ipi) faqat vektor xotira manzili (vmca), vektor uzunligi konfiguratsiyasi (vsetvl) va vektorni olish (vf) ko'rsatmalaridan iborat. Boshqa Hwacha ko'rsatmalari Hwacha ma'lumotlarini mahalliy sifatida boshqarish uchun bajariladi.


Download 100.9 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling