A. M. Kazennov udc: 04. 42 Moskva fizika-texnika instituti (Davlat universiteti), Rossiya, 141700, Dolgoprudniy, bosh. Institut, 2010 yil sentyabrda qabul qilingan, 2010 yil 20 sentyabrda qayta ko'rib chiqilgan mavhum


- G200 kontekstini almashtirish protsedurasidan o'n baravar tezroq 2006 yil 0 301 -


Download 1.25 Mb.
Pdf ko'rish
bet5/11
Sana20.12.2022
Hajmi1.25 Mb.
#1035614
1   2   3   4   5   6   7   8   9   10   11
Bog'liq
crm602 (1)

- G200 kontekstini almashtirish protsedurasidan o'n baravar tezroq
2006 yil
0
301
- bir vaqtning o'zida bir nechta hisoblash iplarini bajarish;
2008 yil
(sozlanishi mumkin)
Arxitektura
Bozorga chiqarilgan yili
Tranzistorlar soni, mln. Oqimli
protsessorlar soni (CUDA yadrolari) SM
uchun umumiy xotira, SM uchun KB L1 kesh,
KB L2 kesh, KB
- 64-bitli manzillashni qo'llab-quvvatlash;
Xotiraga kirishni bashorat qilish samaradorligi yaxshilandi.
240
Machine Translated by Google


CUDA texnologiyasining dasturiy qismi
Funktsiyalar va o'zgaruvchilar uchun spesifikasiyalar
• Grid (Grid) - bitta qurilmada ishlaydigan bloklar birlashmasi. • Blok (Blok) - to'liq bitta SMda bajariladigan
iplar birlashmasi. Unda bor
A. M. Kazyonnov
Markaziy protsessorda (host) faqat dastur algoritmining ketma-ket qismlari, qurilmaga ma'lumotlarni tayyorlash va
nusxalash, yadro uchun parametrlarni o'rnatish va uni ishga tushirish amalga oshiriladi. Algoritmning parallel qismlari yadrolarga
hosil bo'lib, ular qurilmadagi ko'p sonli iplarda bajariladi.
Dasturni GPU ostida amalga oshirish uchun NVIDIA C tili uchun kengaytmalarini chiqardi, bunday dasturlarni yaratish
uchun NVCC kompilyatori, CUDA qo'ng'iroqlarini o'z ichiga olgan fayllar uchun yangi *.cu kengaytmasini taqdim etdi. C tili
kengaytmalariga quyidagilar kiradi:
__global__ spetsifikatsiyasi yadroni belgilaydigan funktsiyalar uchun ishlatiladi (ular bir nechta maxsus
o'zgaruvchilardan o'tadi). __global__ funksiyalari faqat voidni qaytarishi mumkin. __global__ spetsifikatsiyasi
faqat alohida holatda qo'llaniladi.
302
• Thread (Thread, thread) - dasturni bajarish birligi. Uning blok ichida o'ziga xos identifikatori mavjud. • Warp (Warp) - bir
vaqtning o'zida jismoniy ravishda ishlaydigan 32 ta ketma-ket ip. • Yadro — algoritmning tarmoqda ishlaydigan parallel
qismi.
qurilma
qurilmasi
Keling, asosiy atamalar va ular o'rtasidagi munosabatlar bilan tanishamiz [CUDA C Best Practices, 2010].
hosta
- funktsiyadan manzilni ololmaysiz (__global__ bundan mustasno);
• funksiyalar va o'zgaruvchilar uchun spetsifikatsiyalar, •
yangi o'rnatilgan ma'lumotlar turlari, • o'rnatilgan o'zgaruvchilar
(yadro ichida), • yadroni C kodidan boshlash uchun direktiva.
hosta
mezbon
4-jadval. CUDA Spesifikatori ishga tushadigan funksiya
spetsifikatsiyalari Qurilma __device__ __global__ __host__ dan chaqirilishi
mumkin
protsessor.
• Xost (Host) – dasturning bajarilishini boshqaruvchi markaziy protsessor birligi. • Device (Device) – markaziy
protsessor vazifasini bajaradigan videoadapter
• Funktsiya spetsifikatsiyalari

Download 1.25 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   11




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling