Основы распараллеливания алгоритмов
Уточнение закона Амдаля – типичная форма ускорения кластера
Download 227.5 Kb.
|
Лекция 8
8.5 Уточнение закона Амдаля – типичная форма ускорения кластераРассмотрим теперь формальную модель ускорения многопроцессорной системы MPP архитектуры, предположив, что топология связей в ней представляет решетку процессоров. Такая архитектура наиболее типична для кластерных систем. Проводя аналогии между кристаллической решеткой и решеткой процессоров, можно прийти к выводу, что модель кластера может быть представлена, в первом приближении, как модель Изинга (Модель Изинга — математическая модель статистической физики, предназначенная для описания намагничивания материала).. Такая модель отражает ситуацию, когда узлы решетки процессоров нагружены равномерно, а эффективность связи между узлами отражается величиной «порядка» модели Изинга. Приведем кратко вывод асимптотической формулы для ускорения кластерной системы, описываемой моделью Изинга. Пусть время работы алгоритма на одном процессе составляет T1. Разобьем в первом приближении алгоритм на две функциональные части, предположив, что малая часть α является чисто последовательной (выполняется на одном процессоре), а оставшаяся часть (1- α) может быть распараллелена на систему из N процессоров. Тогда время выполнения алгоритма на системе из N процессоров может быть представлена следующим образом: (1)
(2)
что соответствует закону Амдаля. В формуле (2) не учтено время, необходимое системе для пересылок данных (взаимодействия) между процессорами (узлами) в решетках кластера. Учет времени, необходимого на эти накладные расходы, когда не совершается никаких вычислений, приводит к трансформации выражения (1):
(3)
где τij – время взаимодействия между i – тым и j – м процессором (узлом)
(4)
где τ0 – некоторое характерное время (временной масштаб). Все остальные переменные и получающиеся коэффициенты есть суть безразмерные величины. Здесь - функция расстояния между узлами, d – величина, зависящая от характера соединения разных процессоров друг с другом.
(5)
где β – коэффициент, отражающий архитектуру (диаметр системы), γ – коэффициент, равный отношению производительности узла (процессора) к производительности связи (скорость линка).
следовательно ускорение SN будет равно: (7)
Исследование зависимости (7) показывает, что SN имеет максимум (см. рис.). Это означает, что существует некоторое оптимальное количество узлов (процессоров), при котором эффективность кластера оказывается наибольшей. SN достигает максимума при количестве процессоров:
(8)
Следовательно, оптимальное количество узлов кластера наиболее существенно зависит от диаметра системы и отношения производительности узла к производительности линка. В точке максимума будет наблюдаться приблизительно следующее ускорение:
(8)
Download 227.5 Kb. Do'stlaringiz bilan baham: |
ma'muriyatiga murojaat qiling