Основы распараллеливания алгоритмов


Уточнение закона Амдаля – типичная форма ускорения кластера


Download 227.5 Kb.
bet6/6
Sana01.04.2023
Hajmi227.5 Kb.
#1316546
TuriЛекция
1   2   3   4   5   6
Bog'liq
Лекция 8

8.5 Уточнение закона Амдаля – типичная форма ускорения кластера


Рассмотрим теперь формальную модель ускорения многопроцессорной системы MPP архитектуры, предположив, что топология связей в ней представляет решетку процессоров. Такая архитектура наиболее типична для кластерных систем. Проводя аналогии между кристаллической решеткой и решеткой процессоров, можно прийти к выводу, что модель кластера может быть представлена, в первом приближении, как модель Изинга (Модель Изинга — математическая модель статистической физики, предназначенная для описания намагничивания материала).. Такая модель отражает ситуацию, когда узлы решетки процессоров нагружены равномерно, а эффективность связи между узлами отражается величиной «порядка» модели Изинга.


Приведем кратко вывод асимптотической формулы для ускорения кластерной системы, описываемой моделью Изинга. Пусть время работы алгоритма на одном процессе составляет T1. Разобьем в первом приближении алгоритм на две функциональные части, предположив, что малая часть α является чисто последовательной (выполняется на одном процессоре), а оставшаяся часть (1- α) может быть распараллелена на систему из N процессоров. Тогда время выполнения алгоритма на системе из N процессоров может быть представлена следующим образом:


(1)

В этом случае ускорение

(2)

что соответствует закону Амдаля. В формуле (2) не учтено время, необходимое системе для пересылок данных (взаимодействия) между процессорами (узлами) в решетках кластера. Учет времени, необходимого на эти накладные расходы, когда не совершается никаких вычислений, приводит к трансформации выражения (1):

(3)

где τij – время взаимодействия между i – тым и j – м процессором (узлом)
Естественно, в оптимально сконфигурированной системе нас интересует минимизация последнего члена в (3). Представим его следующим образом:

(4)

где τ0 – некоторое характерное время (временной масштаб). Все остальные переменные и получающиеся коэффициенты есть суть безразмерные величины. Здесь - функция расстояния между узлами, d – величина, зависящая от характера соединения разных процессоров друг с другом.
Решение такой задачи аналогично рассмотрению фазовых переходов второго рода в решетке из N узлов., в каждом из которых находится «диполь» с осью, перпендикулярной плоскости решетки. Диполь может иметь две противоположные ориентации (в нашем случае это прохождение или не прохождение или не прохождение информации), так что общее число возможных конфигураций диполей в решетке равно 2N. Эта модель известна в литературе как модель Изинга.
Предполагая, что все процессоры одинаково нагружены, (где v0, V0 – скорости передачи сообщения между узлами и соответствующий масштаб), dij  d, получаем:

(5)

где β – коэффициент, отражающий архитектуру (диаметр системы), γ – коэффициент, равный отношению производительности узла (процессора) к производительности связи (скорость линка).
Тогда (3) примет вид:
(6)

следовательно ускорение SN будет равно:


(7)

Исследование зависимости (7) показывает, что SN имеет максимум (см. рис.). Это означает, что существует некоторое оптимальное количество узлов (процессоров), при котором эффективность кластера оказывается наибольшей. SN достигает максимума при количестве процессоров:

(8)

Следовательно, оптимальное количество узлов кластера наиболее существенно зависит от диаметра системы и отношения производительности узла к производительности линка. В точке максимума будет наблюдаться приблизительно следующее ускорение:

(8)




Download 227.5 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling