3. Ko'p sonli tugunlar va GPUlarda ishlaganda Fortran DVMH da ishlab chiqilgan parallel dasturlarning samaradorligini tahlil qilish.
Quyidagi kichik bo'limlarda "Lomonosov" MDUning superkompyuter majmuasida olingan dasturlarning bajarilish vaqtlari (sekundlarda) keltirilgan [5]. Xostda ishlaydigan kodni kompilyatsiya qilish uchun Intel kompilyatorlarining 13.0 versiyasi, tezlatgichlarda ishlaydigan kodni kompilyatsiya qilish uchun Portlend guruhining CUDA Fortran kompilyatorining 12.9 versiyasi va NVIDIA CUDA C 4.0 versiyasi ishlatilgan. Tugunlar orasidagi o'zaro ta'sir uchun Intel MPI kutubxonasi 4.0.3 versiyasi ishlatilgan.
3.1. "G'or" dasturi
To'r o'lchamiga qarab, 1 protsessor yadrosida bajarilishi bilan solishtirganda, Cavern dasturining bitta GPUda bajarilishini tezlashtirish [4] da nashr etilgan.
1 va 2-jadvallarda Cavern dasturining 3200x3200 o'lchamdagi turli xil sonli yadrolar va GPUlarda (sekundlarda) 200 marta takrorlanishi uchun bajarilish vaqtlari ko'rsatilgan.
1-jadval
Cavern dasturining 3200x3200 o'lchamdagi turli xil yadrolarda ishlash vaqti
1 2 4 8 16 32 64 128 256 400 512 1024
1241,83 631,47 332,36 182,95 100,05 75,8 40,20 21,33 11,74 7,11 6,44 3,48
1024 yadrodan foydalanganda Cavern dasturi 1 yadroda ishlashga nisbatan 357 marta tezlashdi. 1 ta tezlatgichdan foydalanilganda, dasturni 1 yadroda ishlashga nisbatan dastur 17 marta tezlashadi. Tezlatgichlardan foydalangan holda olingan maksimal tezlashtirish dasturni 1 yadroda bajarish bilan solishtirganda 390 marta.
jadval 2
Cavern dasturining 3200x3200 o'lchamdagi turli xil GPU-larda ishlash vaqti
1 2 4 8 16 32 64 128 256 400
73,07 39,34 19,94 11,65 7,17 4,80 3,96 3,45 3,32 3,19
3.2. Konteyner dasturi
3 va 4-jadvallarda "Container" dasturining turli xil sonli yadrolar va GPU-larda bajarilish vaqtlari ko'rsatilgan.
3-jadval
"Konteyner" dasturining turli xil sonli yadrolarda bajarilish vaqti
To‘r, takrorlashlar soni 4 8 16 32 64 128 256 512 1024 2048
Do'stlaringiz bilan baham: |