1. numa arxitekturasi
Download 196.16 Kb.
|
1 2
Bog'liq6-маъруза
6-ma’ruza Xotiraga bir xil bo’lmagan ruxsatlilik tizimlari (NUMA), xotiraga bir xil bo’lgan ruxsatliik tizimlari (UMA) Reja: 1. NUMA arxitekturasi 2. UMA arxitekturasi 1. NUMA arxitekturasi Bu ma'ruza boshida biz umumiy xotiraga ega kompyuterlar haqida gapirishni davom ettiramiz. Ba'zida klassik 𝑆𝑀𝑃 - kompyuterlar har qanday protsessorga har qanday xotira moduliga teng kirishni ta'minlovchi 𝑼𝑴𝑨 (𝑼𝑛𝑖𝑓𝑜𝑟𝑚 𝑴𝑒𝑚𝑜𝑟𝑦 𝑨𝑐𝑐𝑒𝑠𝑠) arxitekturasiga ga , deyishadi . Biz eslaganimizdek, umumiy xotiraga ega bo'lgan kompyuterlarning asosiy kamchiliklaridan biri - ko'p sonli protsessorlarni umumiy xotiraga ulashning jismoniy imkonsizligi. Kompromissga erishish uchun, ya'ni bir tomondan, umumiy manzil maydonini saqlab qolish uchun, boshqa tomondan, bu tugunni iloji boricha ko'proq hisoblash tugunlarini ulash uchun sinab ko'ring, biz klassik of modifikatsiyasiga keldik. Xotiraga kirishni bir xilligini oldini olish orqali arxitektura, ya'ni ular arxitekturaga o’tdila. 𝑵𝑜𝑛 𝑼𝑛𝑖𝑓𝑜𝑟𝑚 𝑴𝑒𝑚𝑜𝑟𝑦 𝑨𝑐𝑐𝑒𝑠𝑠 Tarixiy jihatdan, bunday birinchi kompyuter 20 -asrning 70 -yillari oxirida kompyuter *. U hisoblash tugunlari (klasterlar) majmuasidan iborat edi (6.1 -rasm). 6.1 -rasm. NUMA arxitekturasi, kompyuter Cm *. Klasterlar o'rtasida muloqot qilishda asosiy narsa xotira boshqaruvchisi bo'lib, u xotira modulida kerakli ma'lumotlar saqlanadigan manzilning yuqori tartibli bitlari bilan belgilanadi. Bundan tashqari, bu arxitekturada klasterlararo avtobus to'siq edi. Turli xil klasterlar etarlicha ko'p bo'lsa, klasterlararo avtobusda katta yuk olinadi, bu esa dasturni samarali bajarilishi uchun protsessorlar sonini ko'paytirishga imkon bermaydi. Shu sababli, boshqa arxitektura turlari taklif qilindi , bu erda klasterlararo avtobus o'rniga kalitlar yoki kalitlar to'plami ishlatilgan. Kompyuter 6.2 -rasmda ko'rsatilgan arxitekturaga ega edi. Protsessorlar va xotira bloklari o'rtasidagi aloqa ikki guruhli kalitlar ierarxiyasi orqali amalga oshiriladi. Har bir kalitga 4 protsessor ulangan va har bir kalit 4 -darajali ikkinchi kalitga ulangan. 6.2 -rasm. BBN Butterfly arxitekturasi. Bu kompyuterda arxitekturaning xilma -xilligi natijasida mahalliy ma'lumotlarga kirish 2 𝜇𝑠 , masofali ma'lumotlarga esa 6 𝜇𝑠 ga yaqin bo'lgan . Kesh xotirasi paydo bo'lgunga qadar hamma narsa yaxshi edi. Muammo shundaki, agar protsessor kesh xotirasida ma'lumotlar bilan ishlasa, u o'zgaruvchilar qiymatlarini o'zgartiradi, keyin ularni umumiy xotiraga qaytaradi va boshqa protsessor bir vaqtning o'zida sodir bo'lishi mumkin. yangi ma'lumotlar hali "tortib" olmagan umumiy xotiradan eskirgan ma'lumotlar bilan ishlashni boshlashi mumkin. Bu muammoning nomi 𝒄𝒂𝒄𝒉𝒆 𝒄𝒐𝒉𝒆𝒓𝒆𝒏𝒄𝒆 𝒑𝒓𝒐𝒃𝒍𝒆𝒎 . Bunga qarshi kurashish uchun protsessorlarning apparat xususiyatlari ishga tusha boshladi, ular apparat keshini moslashtiradi. Ushbu muammo apparat darajasida hal qilingan kompyuterlar arxitektura bilan nomlangan: ℎ 𝑒 𝒄𝑜𝑛𝑒𝑟𝑒𝑛𝑡 𝑵𝑜𝑛 𝑼𝑛𝑖𝑓𝑜𝑟𝑚 𝑴𝑒𝑚𝑜𝑟𝑦 𝑴𝑒𝑚𝑜𝑟𝑦 𝑨𝑐𝑐𝑒𝑠𝑠 Shunday qilib, endi kompyuterlar 𝑐𝑐𝑁𝑈𝑀𝐴 arxitekturasi bo'yicha qurilmoqda. Qachon ular mahalliy ma'lumotlarga qaraganda masofaviy ma'lumotlarga kirish uchun qancha vaqt ketadi degan savolga javob berishga odatlanganlarida. Agar masofaviy ma'lumotlarga kirish mahalliy xotiradagi ma'lumotlarga qaraganda bir necha foizga ko'p bo'lsa, unda bu katta muammo emas. Biroq, aslida bunday emas. Ko'pincha, vaqt farqi 2 dan 7 martagacha bo'lib, bu ish faoliyatini sezilarli darajada ta'sir qiladi. 𝑐𝑐𝑁𝑈𝑀𝐴 arxitekturasidagi kompyuterga misol qilib, 2000 yildan buyon ishlab chiqarilayotgan 𝑯𝒆𝒘𝒍𝒆𝒕𝒕 - 𝑷𝒂𝒄𝒌𝒂𝒓𝒅 computer kompyuterini olaylik. Ushbu kompyuterlarning standart konfiguratsiyasi tizimni kengaytirish imkoniyati bilan 2 dan 64 gacha protsessorlardan iborat. Kompyuterda 256 Gbaytgacha operativ xotira bor edi va ikkita protsessor varianti ishlatilgan: • 𝑃𝐴 -8600, 𝑃𝐴 -8700, 𝑃𝐴 -8900 • 𝐼𝑛𝑡𝑒𝑙 𝐼𝐴 ⁄64: 𝐼𝑡𝑎𝑛𝑖𝑢𝑚 , 𝐼𝑡𝑎𝑛𝑖𝑢𝑚 2 Bu kompyuterlarning tuzilishi hisoblash xujayrasi (kataklar) haqidagi asosiy tushunchaga asoslangan edi (6.3 -rasm). U 4 ta protsessordan iborat edi. Hujayraning asosiy komponenti har bir kishi hamma bilan muloqot qilishi uchun murakkab hujayra boshqaruvchi sxemasi edi. 6.3 -rasm. Hewlett-Packard Superdome kompyuter tuzilishi. Protsessor-nazoratchi kanalining tarmoqli kengligi sekundiga 2 Gb, xotira banki-kontroller kanali, tashqi nazoratchi-kalit-8 Gb. Bu katakchalarga asoslanib, har birida ikkita kalitli 2 ta tokchadan iborat asosiy konfiguratsiya qurilgan (6.4 -rasm). Ya'ni, asosiy konfiguratsiyada bizda 4 ta kalit, 16 ta hujayra va 64 ta protsessor bor. Har bir kommutatorda 8 ta port mavjud: hujayralar bilan aloqa qilish uchun 4 ta port, kalitlar bilan aloqa qilish uchun 3 ta port va 8 -port bo'sh qoladi. 6.4 -rasm. Kompyuterning asosiy konfiguratsiyasi. Ushbu kompyuterda protsessor xotiraga kirganda uch turdagi kechikishlar aniqlandi: • Protsessor va xotira bitta katakchada joylashgan - bu holda kechikish minimal bo'ladi • Protsessor va xotira har xil katakchalarda joylashgan, lekin bu katakchalarning ikkalasi ham bitta kalitga ulangan • Protsessor va xotira har xil katakchalarda joylashgan va bu ikkala katak ham har xil kalitlarga ulangan - bu holda, so'rov ikkita kalitdan o'tishi kerak va kechikish maksimal bo'ladi. Yilda 𝐻𝑃 𝑆𝑢𝑝𝑒𝑟𝑑𝑜𝑚𝑒, juda yaxshi ko'rsatkich bo'lib, faqat 1,6 barobar 4 64 Protsessorlar ortadi o'tish o'rtacha kutish vaqti. Keling, bu kompyuterlarning ishlash chastotasini 750 MGts chastotali va soatiga 4 operatsiyani bajaradigan 3 -8700 protsessorida baholaymiz , bu esa 3 Gflopsning eng yuqori ko'rsatkichini beradi. Shuning uchun 64 protsessor konfiguratsiyasining eng yuqori ko'rsatkichi 192 Gflops. Umumiy xotiraga ega kompyuterlarning natijalarini sarhisob qilib, biz ushbu arxitekturali kompyuterlarning ishlashining pasayishining asosiy sabablarini sanab o'tamiz: 1. Amdal qonun. 2. 𝑐𝑐𝑵𝑼𝑴𝑨 (xotiraga kirishning heterojenligi). 3. 𝒄𝒄𝑁𝑈𝑀𝐴 (keshni yarashtirish kerak). 4. Xotiraga kirishda ziddiyatlar. 5. Protsessorlarning hisoblash yuklamasini muvozanatlash. 6. Shaxsiy protsessorlarning ishlashi. 7. ... Keling, umumiy xotiraga ega kompyuterlar haqida Amdahl qonuni haqida gapiraylik. Eslatib o'tamiz, qonun quyidagi formula bilan belgilanadi: bu erda 𝛼 - ketma -ket bajariladigan operatsiyalarning ulushi, 𝑝 - tizimdagi protsessorlar soni. Dasturning bajarilish vaqti ketma -ket bajariladigan operatsiyalar ulushi bilan belgilanadi. Umumiy xotirali parallel dasturlarning modellaridan foydalanganda, umumiy ma'lumotlarga kirishni sinxronlashtirish bilan bog'liq bo'lgan ketma -ket kodning qo'shimcha bo'limlari paydo bo'ladi, masalan, muhim bo'limlar. Va protsessorlarning hisoblash yuklarining muvozanatiga kelsak, bizda shunday holat bor: qancha protsessor ishlatilsa, har bir protsessor uchun hisoblash maydoni shuncha kichik bo'ladi. Shunda siz har bir protsessor juda kam operatsiyalarni oladi va o'z sohasida hisoblashdan ko'ra protsessorlar o'rtasida muloqotga ko'proq vaqt sarflanadi degan xulosaga kelishingiz mumkin. To'rtburchaklar va uchburchakli hududlar bo'lsa, protsessorlarning hisoblash yuklarini muvozanatlash mumkin. Download 196.16 Kb. Do'stlaringiz bilan baham: |
1 2
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling