Общая схема чипа nv40


Вершинные процессоры и выборка данных


Download 1.09 Mb.
bet2/6
Sana21.04.2023
Hajmi1.09 Mb.
#1369552
TuriПрезентация
1   2   3   4   5   6
Bog'liq
Архитектура графического процессора

Вершинные процессоры и выборка данных

  • Поддержка разных т.н. «делителей частоты» для потоков исходных данных вершин.
  • Каждый поток может иметь свой собственный делитель значения индекса (т.н. Frequency Stream Divider). Таким образом, иногда отпадает необходимость дублировать данные, и мы экономим объем и ПСП локальной памяти и системной памяти адресуемой через AGP.

Блок схема вершинного процессора NV40

Параметры вершинного процессора NV40


Версия вершинных шейдеров

2.0

2. a

3.0 (NV40)

Число инструкций в коде шейдера

256

256

512 и более

Число исполняемых инструкций

65535

65535

65535 и более

Предикаты

Нет

Нет

Есть

Временных регистров

12

13

32

Константных регистров

256 и более

256 и более

256 и более

Статические переходы

Да

Да

Да

Динамические переходы

Нет

Да

Да

Глубина вложенности динамических переходов

Нет

24

24

Выбор значений текстур

Нет

Нет

Да(4)

Пиксельные процессоры и организация закраски

  • Число TMU – теперь у нас только по одному TMU на каждый пиксель квада. Всего у нас 4 процессора квадов, в каждом по 4 TMU, таким образом, всего их 16.
  • Новые TMU поддерживают анизотропную фильтрацию с соотношением сторон до 16:1 включительно (т.н. 16х, у NV3X было до 8х) и, наконец-то, научились выполнять все виды фильтрации с плавающими форматами текстур. Правда, при условии 16 битной точности компонент (FP16) .
  • Двухуровневая организация кэширования текстур
  • На каждый пиксель приходится по два ALU, причем каждое из них может выполнить две различные(!) операции над разным числом произвольно выбираемых компонент вектора (до 4х).
  • Поддержка MRT (Multiple Render Targets – рендеринг в несколько буферов).
  • Поддержка MSAA .

Параметры пиксельного процессора NV40


Версия пиксельного шейдера

2.0

2.a

2.b

3.0 (NV40)

Вложенность выборок текстур до

4

Без ограничений

4

Без ограничений

Выборок значений текстур до

32

Без ограничений

Без ограничений

Без ограничений

Длинна кода шейдера

32 + 64

512

512

512 и более

Исполняемых инструкций шейдера

32 + 64

512

512

65535 и более

Интерполяторы

2 + 8

2 + 8

2 + 8

10

Предикаты

Нет

Да

Нет

Да

Временных регистров

12

22

32

32

Константных регистров

32

32

32

224

Произвольная перестановка компонент

Нет

Да

Нет

Да

Инструкции градиента (D D X/ D DY)

Нет

Да

Нет

Да

Глубина вложенности динамических переходов

Нет

Нет

Нет

24

2D и Видеопроцессор

  • Процессор содержит четыре функциональных блока (целочисленное ALU, векторное целочисленное ALU с 16 компонентами, блок загрузки и выгрузки данных и блок управления переходами и условиями) и может таким образом выполнять до четырех различных операций за такт. Формат данных – целые числа, видимо 16 битной или 32 битной точности (точно не известно, но для некоторых алгоритмов 8 бит было бы недостаточно).
  • Такой процессор способен существенно разгрузить CPU, особенно в случае больших разрешений видео, таких, как все более набирающие популярность форматы HDTV. Не известно, используются ли возможности этого процессора для ускорения 2D графики, особенно некоторых достаточно сложных функций GDI+ - было бы логично задействовать его на этом поприще, но точной информации об этом аспекте у нас нет.

Download 1.09 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling