- Поддержка разных т.н. «делителей частоты» для потоков исходных данных вершин.
- Каждый поток может иметь свой собственный делитель значения индекса (т.н. Frequency Stream Divider). Таким образом, иногда отпадает необходимость дублировать данные, и мы экономим объем и ПСП локальной памяти и системной памяти адресуемой через AGP.
Блок схема вершинного процессора NV40 Параметры вершинного процессора NV40
Версия вершинных шейдеров
|
2.0
|
2. a
|
3.0 (NV40)
|
Число инструкций в коде шейдера
|
256
|
256
|
512 и более
|
Число исполняемых инструкций
|
65535
|
65535
|
65535 и более
|
Предикаты
|
Нет
|
Нет
|
Есть
|
Временных регистров
|
12
|
13
|
32
|
Константных регистров
|
256 и более
|
256 и более
|
256 и более
|
Статические переходы
|
Да
|
Да
|
Да
|
Динамические переходы
|
Нет
|
Да
|
Да
|
Глубина вложенности динамических переходов
|
Нет
|
24
|
24
|
Выбор значений текстур
|
Нет
|
Нет
|
Да(4)
| Пиксельные процессоры и организация закраски - Число TMU – теперь у нас только по одному TMU на каждый пиксель квада. Всего у нас 4 процессора квадов, в каждом по 4 TMU, таким образом, всего их 16.
- Новые TMU поддерживают анизотропную фильтрацию с соотношением сторон до 16:1 включительно (т.н. 16х, у NV3X было до 8х) и, наконец-то, научились выполнять все виды фильтрации с плавающими форматами текстур. Правда, при условии 16 битной точности компонент (FP16) .
- Двухуровневая организация кэширования текстур
- На каждый пиксель приходится по два ALU, причем каждое из них может выполнить две различные(!) операции над разным числом произвольно выбираемых компонент вектора (до 4х).
- Поддержка MRT (Multiple Render Targets – рендеринг в несколько буферов).
- Поддержка MSAA .
Параметры пиксельного процессора NV40
Версия пиксельного шейдера
|
2.0
|
2.a
|
2.b
|
3.0 (NV40)
|
Вложенность выборок текстур до
|
4
|
Без ограничений
|
4
|
Без ограничений
|
Выборок значений текстур до
|
32
|
Без ограничений
|
Без ограничений
|
Без ограничений
|
Длинна кода шейдера
|
32 + 64
|
512
|
512
|
512 и более
|
Исполняемых инструкций шейдера
|
32 + 64
|
512
|
512
|
65535 и более
|
Интерполяторы
|
2 + 8
|
2 + 8
|
2 + 8
|
10
|
Предикаты
|
Нет
|
Да
|
Нет
|
Да
|
Временных регистров
|
12
|
22
|
32
|
32
|
Константных регистров
|
32
|
32
|
32
|
224
|
Произвольная перестановка компонент
|
Нет
|
Да
|
Нет
|
Да
|
Инструкции градиента (D D X/ D DY)
|
Нет
|
Да
|
Нет
|
Да
|
Глубина вложенности динамических переходов
|
Нет
|
Нет
|
Нет
|
24
| 2D и Видеопроцессор - Процессор содержит четыре функциональных блока (целочисленное ALU, векторное целочисленное ALU с 16 компонентами, блок загрузки и выгрузки данных и блок управления переходами и условиями) и может таким образом выполнять до четырех различных операций за такт. Формат данных – целые числа, видимо 16 битной или 32 битной точности (точно не известно, но для некоторых алгоритмов 8 бит было бы недостаточно).
- Такой процессор способен существенно разгрузить CPU, особенно в случае больших разрешений видео, таких, как все более набирающие популярность форматы HDTV. Не известно, используются ли возможности этого процессора для ускорения 2D графики, особенно некоторых достаточно сложных функций GDI+ - было бы логично задействовать его на этом поприще, но точной информации об этом аспекте у нас нет.
Do'stlaringiz bilan baham: |