- Система Cm* (конец 70х) – первый NUMA компьютер. Набор кластеров, соединенных между собой через межкластерную шину.
- Каждый кластер объединяет процессор, контроллер памяти, модуль памяти, плюс вспомогательные устройства, соединенные между собой посредством локальной шины.
- Когда процессору нужно выполнить операции чтения или записи, он посылает запрос с адресом своему контроллеру памяти. Контроллер анализирует старшие разряды адреса и определяет, в каком модуле хранятся нужные данные. Если адрес локальный – запрос выставляется на локальную шину, запрос для удаленного кластера отправляется через межкластерную шину.
- Программа, хранящаяся в одном модуле памяти, может выполняться любым процессором системы. Различие заключается лишь в скорости выполнения. Локальные ссылки отрабатываются намного быстрее, чем удаленные (разрыв до 700%). Поэтому процессор того кластера, где хранится программа, выполнит ее на порядок быстрее, чем другие.
NUMA: Компьютер BBN Butterfly - BBN Butterfly (80е). В максимальной конфигурации 256 процессоров.
- Каждый ВУ содержит процессор, локальную память и контроллер памяти, который определяет – является запрос к памяти локальным или его необходимо передать удаленному узлу через коммутатор.
- С точки зрения программиста память – единое адресное пространство.
- Удаленные ссылки реализуются в 3 раза медленнее локальных (6 мкс против 2 мкс).
- На базе архитектуры ссNUMA выпускается множество многопроцессорных систем.
- Примеры: HP 9000 V-class, SGI Origin2000, Sun HPC 10000, IBM/Sequent NUMA-Q 2000, SNI RM600 и др.
- Масштабируемость NUMA-систем ограничи-вается объемом адресного пространства, возможностями аппаратуры поддержки кэш-когерентности и возможностями (единой) ОС управлению большим числом процессоров. Максимальное число процессоров в NUMA-системах обычно не превышает 256.
Компьютер НР Superdome (1) - Компьютеры серии Hewlett-Packard Superdome появились в 2000; в 2001 заняли 147 позиций в списке Тор500, держались в списке до конца 2006.
- В стандартной комплектации может иметь от 2 до 64 процессоров с возможностью расширения системы. Все процессоры имеют доступ к общей памяти, организованной согласно ccNUMA-архитектуре.
- Память всего компьютера неоднородна и физически распределена, но логически остается общей, т.е. все процессоры в едином адресном пространстве, адресуя любой байт памяти посредством стандартных операторов чтения-записи.
- Доступ к локальной памяти идет немного быстрее, чем доступ к удаленной памяти.
- Содержимое кэш-памяти отдельных процессоров на уровне аппаратуры согласуется с содержимым ОП.
- Вычислительная ячейка (cell) – базовый 4-проц. блок компьютера, симметричный мультипроцессор, реализованный на одной плате.
- Контроллер выполняет интерфейсные функции между процессорами, памятью и внешними устройствами. Отвечает за кэш-когерентность.
- Память ячейки – 2 банка с параллельным доступом
Do'stlaringiz bilan baham: |