Mavzu: lu-foktororizatsiyasida paralellikdan chiqarish Mundarija


Download 217 Kb.
bet6/6
Sana05.01.2022
Hajmi217 Kb.
#217500
1   2   3   4   5   6
Bog'liq
Musayev

N x N

OpenMP siz

OpenMP yordamida

Unumdorlik

4 ta 1024

5141,619

3862,97

1,331

16 ta 512

5381,641

4230,043

1,279

64 ta 256

5498,038

4550,084

1,208

256 ta 128

5657,647

5166,368

1,109

1024 ta 64

5954,337

5862,022

1,016

4096 ta 32

7029,633

7888,272

0,891

16384 ta 16

9878,041

13121,636

0,753

Natijalardan shuni ko’rishimiz mumkin, bir oqimli ketma-ket qayta ishlashаnmalarga oshirganada OpenMP yordamida amalga oshirganga nisbatan ko’proq vaqt talab qilishi mumkin.

2 – rasm. OpenMP yordamida 2 yadroli protssesorda erishilgan unumdorlikni grafik ko’rinishi.



II BOB

Kurs ishi bajarish jarayonlari

2.1 Paralel tizimda oxirgi elementlar usuli.


Bizga quyidagi murakkab ifodalar berilgan bo’lsin:

1) Е=(х+(а*((b/c)*d)))-(y-z)



2) E'=((a*b)/(c/d)-((y-z)-x)
Bu murakkab ifodalarning parallel hisoblash grafini ishlab chiqamiz. Dastlab Е=(х+(а*((b/c)*d)))-(y-z) ifodani parallel hisoblash grafini ishlab chiqamiz. Buning uchun vertikal ravishda parallel amallar ketma – ketligini gorzontal ravishda o’zgaruvchilarni yozib chiqamiz.Bunda parallel bajariladigan amallar bir – biriga bog’liq bo’lmasligi lozim.

2.1-rasm LU-paralelini sturukturasi

Xuddi shu kabi E'=((a*b)/(c/d)-((y-z)-x) ifoda uchun ham shu grafni tuzib chiqamiz.

Yuqoridagi E va E' ifodalarda amallar soni ham, o’zgaruvchilar soni ham teng. Biroq E ifodani hisoblashda 5 ta takt talab qilinmoqda, E' ifodada esa 3 ta taktning o’zi yetarli bo’lmoqda.


2.2 Paralel tizimda elememtlar.


2.3-rasm.Berilgan ifodani parallel va ketma-ket hisoblashning dasturiy ta’minoti.

Dastur sodda va ixcham bo’lishi uchun faqatgina bitta oynadan foydalanildi. Yuqoridagi rasmdan ko’rish mumkin Y murakkab ifodani ketma-ket va parallel hisoblandi va hisoblash vaqti ham qayt qilingan. Bunda parallel hisoblashni avval qavslarni ochib chiqib hisoblandi, keyin esa o’z berilish holatida hisoblangan. Bu yerda a, b, c, d lar ixtiyoriy haqiqiy sonlar, i esa o’zida [1, 10000] oralig’idagi sonlarni saqlovchi massivdir.



Xulosa

Ushbu kurs ishida LU-foktorizatsiyada parallelikdan chiqarish parallellik texnologiyasida OpenMP tizimlarida keng tadbi qilish axborotlarni joylashtirish, saqlash va saralash amallarini optimallashtirish, xotira resurlaridan foydalanishda siqish algoritmlarining optimal usullarini yaratish va tasvirlarni qayta ishlashda ko`p yadroli protsessorlarning unumdorlik darajasini oshirishga mo`ljallangan parallelashtirish algoritmlarini yaratish. Ishni bajarish davomida quyidagi natijalarga erishildi:



  1. OpenMP tizimlarida axborotni xotirada saqlash muammoli masalalarini tahlil qilgan holda siqish algoritmlarining optimal usullaridan foydalanish yaxshi natija berishi aniqlandi. Bunda tasvirlarni raqamli qayta ishlaganda veyvlet-jarayonidan foydalanish qayta ishlash amallarida optimal yondoshish mumkinligi aniqlandi.

  2. Tasvirlarni qayta ishlashda ko`p yadroli protsessorlarga mo`ljallangan parallelashtirish algoritmlarini qo`llash yaxshi samara berdi. C++ Dasturlash tilidan foydalanildi va parallelashtirishni tashkillashtirib beruvchi OpenMP kompilyatori direktivalaridan foydalanildi va ular yordamida protsessor unumdorlik darajasi oshdi.

  3. Ish davomida tasvirlarni qayta ishlashda tasvir qiymatlarini baytli massivga o`zlashtirish, veyvlet-jarayonlarni amalga oshirganda oqimlarga ajratish usullari vaxotirani parallel holda dinamik joy ajratish kabi jarayonlar bajarildi va yaxshi samaradorlik ko`rsatdi.

  4. Tadqiqot natijalaridan kelib chiqqan ma’lumotlar yordamida parallelashtirishning umumiy usuli yaratildi. Tasvirlar zarrachalar sonini oshirish natijasida parallelashtirish algoritmlari effektivligini ko`rsattish, ba’zida esa butun tasvirni kvadrat qismlarga bo`lgan holda alohida funktsiyalarga ajratish va protsessor oqimlar soniga teng amallarga bo`lib berish ham o`z unumdorligini ko`rsatdi.

  5. Tasvir ma’lumotlarini parallelashtirish algoritimi yordamida oqimlarga ajratish bilan qayta ishlaganimizda ko`p yadroli protsessor unumdorligini quyidagi xususiyat – tasvirning qayta ishlanilayotgan qiymatlar soniga bog`liq ekanligi natijalardan kelib chiqqan holda aniqlandi. Protsessor unumdorligi yetarli darajaga yetgunicha o`sib boradi (tasvirning 256 dan 4096 gacha). Optimal yechim sifatida unumdorlik darajasi protsessorlarning yadrolar soni qiymatiga yaqinlashib boradi.

  6. Parallel qayta ishlashda oqimlar sonining optimal soni protsessorning xisoblash darajasiga teng bo`lishi lozim. Ikta fizik yadroga ega protsessorlar 4 ta mantiqiy oqim yaratib bera olishi va unumdorlik darajasini haqiqiy 4 yadroli protsessor natijasiga yaqinlashtirib berishi mumkin.

Quyidagi kurs ishida yadrolar soni 2 va 4 ga teng bo`lgan turli protsessorlarda o`tqazilgan tajriba natijalari keltirildi. Ishning natijasi – ketma-ket va parallel algoritmlarni tasvirlarni veyvlet-jarayon yordamida siqishda ketgan vaqtini va unumdorlik darajasini aniqlaydigan Dasturiy vosita yaratildi. Dastur 2 va 4 yadroli Intel Corei3 i5 protsessorlarida Windows XP Windows 7 operatsion tizimlarda tajribalar o`tkazildi. Quyidagi dastur yordamida ko`pgina tajribalar o`tqazildi va tajriba natijalar asosida yakuniy xulosalar chiqarildi.

III. Foydalanilgan adabiyotlar:

1. С.А. Немнюгин Средства программирования для многопроцессорных вычислительных систем; Учеб. Пособия для Оброзования и


2. Оленев Н.Н. Оленев Н.Н. Основы параллельного программирования в системе MPI. М.: ВЦ РАН. 2005. 80 с. Web: httD://vvvvvv.ccas.ni/olenev/MPIbookl .pdf fovc.)

3. А.В. Сысоев, И.Б. Мееров Инструменты параллельного программирования в системах с общей памятью: учеб. Пособия для системы дополн. проф. Оброзования и студ. ВУЗов / М. Т. Громкова. - М.:Нижегородский государственный университет им. Н.И. Лобачевского 2010




Internet saytlari:
1.Левин М.П.: «Параллельное программирование с OpenMP» / Левин М.П., режим доступа: http://www.intuit.ru/department/se/OpenMP/

http://www.intuit.ru/department/supercoMPuting/ppmcp/class/free/status/ 2.(Па­раллельное программирование для многоядерных процессоров – курс INTUIT).

3. Intel Parallel Studio – инструмент для созdanия параллельных приложений. – http://www.ixbt.com/soft/intel-parallel-studio.shtml



4. C++ – OpenMP – ExaMPles of basic parallel programming. – http://berenger.eu/blog/2010/07/23/c-OpenMP-exaMPles-of-basic-parallel-programming.html

http://www.intuit.ru/department/calculate/inparallprog/class/free/status/ (Вве­дение в методы параллельного программирования – курс INTUIT).



Download 217 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling