Архитектура вычислительных систем


Параллелизм на уровне потоков (2)


Download 1.12 Mb.
bet9/12
Sana18.06.2023
Hajmi1.12 Mb.
#1565224
1   ...   4   5   6   7   8   9   10   11   12
Bog'liq
Архитектура вычислительных систем.

Параллелизм на уровне потоков (2)

  • Многопроцессорная конфигурация на одном кристалле обеспечивает более высокую скорость обмена между ядрами, чем использование внешних шин, коммутаторов и т.п. При этом у каждого ядра свой набор регистров, кэш, ФУ и др.
  • Компания IBM первой интегрировала в кристалл два процессорных ядра в технологии Power4. Многоядерные процессоры относятся к SMP-системам, но имеют отличия от «классических» SMP-архитектур.
  • Процессор Intel Core 2 Duo. Два ядра, каждое фактически является процессором Pentium M, со своим L1-кэшем команд и L1-кэшем данных. Общий L2-кэш, совместно используемый обеими ядрами.
  • Процессор Core i7. 4 ядра, каждое обладает L1-кэшем команд, L1-кэшем данных и L2-кэшем. Имеется общий для всех ядер L3-кэш.

Параллелизм на уровне потоков (3)

  • Для сравнения: «классическая» мультипроцессорная SMP-архитектура. Каждый микропроцессор имеет свои кэши (в нашем случае два уровня), все ПЭ присоединены к общей шине (bus). Блок Cashe Control отслеживает изменения в памяти, произведенные другими процессорами, и соответственно обновляет содержимое своих кэшей.
  • Эта задача имеет квадратичную сложность от числа процессоров (!!)
  • Итак – идея многоядерности: нужно изолировать в пределах одного процессора выполнение различных потоков инструкций. Каждый поток должен посылать команды на свое ядро, т.е. для реализации процесса параллельного выполнения потоков следует интегрировать два ядра или более в одном ЦП.

Параллелизм на уровне потоков (4)

  • Характерные особенности многоядерных архитектур
  • (1) Многоступенчатая организация кэшей. Общий кэш для нескольких ядер хорошо сказывается на производительности благодаря быстрому доступу к совместно используемой информации. Однако при этом велика вероятность возникновения конфликтов. Многоступенчатая же организация кэша позволяет использовать его наиболее эффективно.
  • (2) Аппаратная реализация многопоточности. Начиная с Power4, многопоточность реализуется на аппаратном уровне: каждое из двух и более ядер выполняет свой поток команд, при задержке выполнения одного потока ресурсы обслуживающего его ядра нельзя передать другому потоку.
  • (3) Поддержка приоритетов. Многопоточная технология SMT (впервые в Power5): аппаратное распределение приоритетов выполнения потоков (8 уровней). Потоку с высоким приоритетом предоставляется большая часть ресурсов. Когда приложению требуется использовать всю полосу пропускания обмена данными с памятью, то процессор автоматически переходит в однопоточный режим.
  • (4) Сверхплотная компоновка. Технология сверхплотной компоновки, особенность которой заключается в применении общей оперативной памяти и межузловых соединений с большой пропускной способностью, позволяет реализовать высокоскоростные соединения между ядрами (в Power5 8 ядер, существуют 12-ядерные, 24-ядерные системы и т.д.).

Download 1.12 Mb.

Do'stlaringiz bilan baham:
1   ...   4   5   6   7   8   9   10   11   12




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling