Поделиться Поделиться

Скорость заполнения (филлрейт)

Скорость заполнения показывает, с какой скоростью видеочип способен отрисовывать пиксели. Различают два типа филлрейта: пиксельный (pixel fill rate) и текстурный (texel rate). Пиксельная скорость заполнения показывает скорость отрисовки пикселей на экране и зависит от рабочей частоты и количества блоков ROP (блоков операций растеризации и блендинга), а текстурная — это скорость выборки текстурных данных, которая зависит от частоты работы и количества текстурных блоков.

Например, пиксельный филлрейт у GeForce GTX 275 равен 633 (частота чипа) * 28 (количество блоков ROP) = 17724 мегапикселей в секунду, а текстурный — 633 * 80 (кол-во блоков текстурирования) = 50640 мегатекселей/с. Чем больше первое число — тем быстрее видеокарта может отрисовывать готовые пиксели, а чем больше второе — тем быстрее производится выборка текстурных данных. Оба параметра важны для современных игр, но они должны быть сбалансированы. Именно поэтому количество блоков ROP в современных чипах обычно меньше количества текстурных блоков.

Количество блоков-шейдеров (пиксельные, вершинные).

Вершинный шейдер отвечает за построение вершин объекта. Определяют возможности современных карт по обработке графических примитивных объектов, и в общем производительность самой карты. Пиксельный шейдер более актуальный чем вершинный поэтому количество их обычно больше. Разделение на пиксельные и вершинные в последнее время (с выходом Direct 10) теряют свою актуальность. Все они заменяются едиными унифицированными шейдерными блоками, кот зависят от конкретной ситуации. Они исп роль как пиксельных, так и вершинных шейдеров, а так же геометрических, кот появились в Direct 10.

Количество блоков текстурирования ТМU

Количество блоков текстурирования ТМU, которые определяют текстурную производительность или скорость выборки и наложения текстур. Особенно это актуальности при анизотропной фильтрации. Наибольшее значение блоки ТМU имеют в старых играх. Сейчас они практически потеряли свою актуальность, т.к. пропускная способность шины памяти в совр коп-рах не хватает для того, чтобы нормально функционировали высокопроизводительные карты. Большинство и них оснащены собственной памятью, которая требуется для хранения необходимых данных, а именно текстур, вершин и т.д.

Блоки операций растеризации (ROP)

Блоки растеризации осуществляют операции записи рассчитанных видеокартой пикселей в буферы и операции их смешивания (блендинга). Как мы уже отмечали выше, производительность блоков ROP влияет на филлрейт и это — одна из основных характеристик видеокарт всех времён. И хотя в последнее время её значение также несколько снизилось, всё ещё попадаются случаи, когда производительность приложений зависит от скорости и количества блоков ROP. Чаще всего это объясняется активным использованием фильтров постобработки и включенным антиалиасингом при высоких игровых настройках.

Ещё раз отметим, что современные видеочипы нельзя оценивать только числом разнообразных блоков и их частотой. Каждая серия GPU использует новую архитектуру, в которой исполнительные блоки сильно отличаются от старых, да и соотношение количества разных блоков может отличаться. Так, блоки ROP компании AMD в некоторых решениях могут выполнять за такт больше работы, чем блоки в решениях NVIDIA, и наоборот. То же самое касается и способностей текстурных блоков TMU — они разные в разных поколениях GPU разных производителей, и это нужно учитывать при сравнении.

Геометрические блоки

Вплоть до последнего времени, количество блоков обработки геометрии было не особенно важным. Одного блока на GPU хватало для большинства задач, так как геометрия в играх была довольно простой и основным упором производительности были математические вычисления. Важность параллельной обработки геометрии и количества соответствующих блоков резко выросли при появлении в DirectX 11 поддержки тесселяции геометрии. Компания NVIDIA первой распараллелила обработку геометрических данных, когда в её чипах семейства GF1xx появилось по несколько соответстующих блоков. Затем, похожее решение выпустила и AMD (только в топовых решениях линейки Radeon HD 6700 на базе чипов Cayman).

Объём видеопамяти

Собственная память используется видеочипами для хранения необходимых данных: текстур, вершин, данных буферов и т. п. Казалось бы, что чем её больше — тем всегда лучше. Но не всё так просто, оценка мощности видеокарты по объему видеопамяти — это наиболее распространенная ошибка! Значение объёма видеопамяти неопытные пользователи переоценивают чаще всего, до сих пор используя именно его для сравнения разных моделей видеокарт. Оно и понятно — этот параметр указывается в списках характеристик готовых систем одним из первых, да и на коробках видеокарт его пишут крупным шрифтом. Поэтому неискушённому покупателю кажется, что раз памяти в два раза больше, то и скорость у такого решения должна быть в два раза выше. Реальность же от этого мифа отличается тем, что память бывает разных типов и характеристик, а рост производительности растёт лишь до определенного объёма, а после его достижения попросту останавливается.

Есть у чипов памяти и более важные параметры, такие как ширина шины памяти и её рабочая частота.

Ширина шины памяти.

Ширина шины памяти является важнейшей характеристикой, влияющей на пропускную способность памяти (ПСП). Большая ширина позволяет передавать большее количество информации из видеопамяти в GPU и обратно в единицу времени, что положительно влияет на производительность в большинстве случаев. Теоретически, по 256-битной шине можно передать в два раза больше данных за такт, чем по 128-битной. На практике разница в скорости рендеринга хоть и не достигает двух раз, но весьма близка к этому во многих случаях с упором в пропускную способность видеопамяти.

Современные игровые видеокарты используют разную ширину шины: от 64 до 384 бит (ранее были чипы и с 512-битной шиной), в зависимости от ценового диапазона и времени выпуска конкретной модели GPU. Для самых дешёвых видеокарт уровня low-end чаще всего используется 64 и реже 128 бит, для среднего уровня от 128 до 256 бит, ну а видеокарты из верхнего ценового диапазона используют шины от 256 до 384 бит шириной. Ширина шины уже не может расти чисто из-за физических ограничений — размер кристалла GPU недостаточен для разводки более чем 512-битной шины, и это обходится слишком дорого. Поэтому наращивание ПСП сейчас осуществляется при помощи использования новых типов памяти (см. далее).

Частота видеопамяти

Ещё одним параметром, влияющим на пропускную способность памяти, является её тактовая частота. А повышение ПСП часто напрямую влияет на производительность видеокарты в 3D-приложениях. Частота шины памяти на современных видеокартах бывает от 533(1066, с учётом удвоения) МГц до 1375(5500, с учётом учетверения) МГц, то есть, может отличаться более чем в пять раз! И так как ПСП зависит и от частоты памяти, и от ширины ее шины, то память с 256-битной шиной, работающая на частоте 800(3200) МГц, будет иметь бо́льшую пропускную способность по сравнению с памятью, работающей на 1000(4000) МГц со 128-битной шиной.

Типы памяти

На современные видеокарты устанавливается сразу несколько различных типов памяти. Старую SDR-память с одинарной скоростью передачи уже нигде не встретишь, но и современные типы памяти DDR и GDDR имеют значительно отличающиеся характеристики. Различные типы DDR и GDDR позволяют передавать в два или четыре раза большее количество данных на той же тактовой частоте за единицу времени, и поэтому цифру рабочей частоты зачастую указывают удвоенной или учетверённой, умножая на 2 или 4. Так, если для DDR-памяти указана частота 1400 МГц, то эта память работает на физической частоте в 700 МГц, но указывают так называемую «эффективную» частоту, то есть ту, на которой должна работать SDR-память, чтобы обеспечить такую же пропускную способность. То же самое с GDDR5, но частоту тут даже учетверяют.

Основное преимущество новых типов памяти заключается в возможности работы на больших тактовых частотах, а соответственно — в увеличении пропускной способности по сравнению с предыдущими технологиями. Это достигается за счет увеличенных задержек, которые, впрочем, не так важны для видеокарт.

Отсюда следует что чем больше объем памяти видеокарты, тем выше производительность. Важные параметры – является рабочая частота шины и ширина шины. Большая ширина шины позволяет передавать большее количество информации в единицу времени из видеопамяти графический центральный процессор GPU и обратно. Что обеспечивает большую производительность видеокарты при равных условиях. Ширина шины составляет бюджетной видеокарты – 64-128 бит, для карт среднего уровня 128-256 бит, для карт высокого уровня – 256-512 бит.


1.2 Описание работы и структурной схемы устройства Скорость заполнения (филлрейт) - Инвестирование - 1

При построении изображения, после обработки видео сигнала центральным процессором, данные поступают на шину данных видеокарты. Далее данные отправляются в блок параллельного выполнения команд, а уже из него в GPU(графический процессор) в котором выполняются следующие дейтсвия:

· Трансформация — простые объекты чаще всего необходимо определенным образом изменить или трансформировать чтобы получился более естественный объект, или имитировать его перемещение в пространстве. Для этого координаты вершин граней объекта (vertex — вертекс) пересчитывают с использованием операций матричной алгебры и геометрических преобразований. В видеокартах для этого интенсивно используется геометрический сопроцессор .

· Расчет освещенности и затенения — для того чтобы объект был виден на экране, нужно рассчитать освещенность и затенение каждого элементарного прямоугольника или треугольника. Причем необходимо имитировать реальное распределение освещенности, т. е. требуется скрыть изменения освещенности между прямоугольниками или треугольниками – этим занимается Блок растеризации.

· Наложение текстур - чтобы создать реалистичное изображение, на каждую элементарную поверхность накладывают текстуру , имитирующую реальную поверхность. Текстуры хранятся в памяти в виде растровых картинок.

· Коррекция дефектов — смоделированные линии и границы объектов, если они не вертикальны или горизонтальны, на экране выглядят угловатыми, поэтому проводят коррекцию изображения, называемую антиалиасинг(anti-aliasing );

После обработки GPU объекты обрабатываются блоком «Z-буфер» :

· Проецирование — трехмерный объект преобразуется в двумерный, но при этом запоминаются расстояния вершин граней до поверхности экрана (координата Z, Z-буфер), на который проецируется объект;

· Удаление скрытых поверхностей — из двумерной проекции трехмерного объекта удаляются все невидимые поверхности.

После расчета всех точек кадра информация о каждом пикселе перемещается в видеопамять.

В блоке управления палитрой и наложением изображения выполняется интерполяция недостающих цветов — если при моделировании объектов использовалось другое количество цветов, нежели чем в текущем режиме видеокарты, то необходимо рассчитать недостающие цвета или удалить избыточные.

Если видеокарта подключена к монитору на основе Электронно лучевой трубки тогда данные поступают в ЦАП(цифро-аналоговый преобразователь) в котором происходит преобразование цифровых сигналов в аналоговые RGB сигналы понятные монитору.

Если видеокарта подключена к цифровому монитору то информация изображения конвертируется в формат экрана монитора.

← Предыдущая страница | Следующая страница →