Shield_DOWN:
И все же я чутка ''не догоняю''.У 960 суперпупер DDR5 да и еще разогнанная(и 760 только без разгона,при этом шина-256 бит),но ведь пропускная способность шины от этого не изменится,128 бит все же будет не хватать.Почему не 196?
Важна не частота памяти и не ширина шины сами по себе. А то, какую пропускную способность может обеспечить совокупность этих двух параметров, достаточность этой пропускной способности для конкретного GPU.
Ну и примененная в Maxwell технология сжатия памяти:
NVIDIA использовала для сжатия памяти цветовую дельта-компрессию (Delta Color Compression). Она основана на хранении полной цветовой информации только о базовом пикселе, для остальных пикселей сохраняется только разница с базовым (дельта). Для этой цели используется матрица 8x8 пикселей. Поскольку близко расположенные пиксели обычно мало отличаются по цвету, хранение для них разницы оказывается по объёму информации выгоднее, чем полного значения цвета. Поэтому в случае дельта-компрессии информация о пикселях занимает меньше места памяти. В результате данные будут быстрее считываться и записываться в видеопамять, и доступные 224 Гбайт в секунду будут соответствовать эффективным 297 Гбайт/с, например.
С одной стороны раз 960 все же незначительно обгоняет предшественницу 760, значит ей такой полосы пропускания достаточно. С другой, у меня на 970 был эксперимент по многочисленным просьбам, оказалось что разгон памяти даже на 256-битной шине приносит заметный результат. А через месяц и Джордан с развернутым тестом на эту тему подтянулся, хотя ни до ни после это никого не интересовало
Все это благодаря еще более усиленной компрессии цвета.
Улучшенная компрессия цвета
Архитектура Pascal привнесла новые алгоритмы дельта-компрессии цвета наряду с компрессией 2:1, которую используют предыдущие семейства GPU NVIDIA (которая также была сделана более эффективной в Pascal). В целом, смысл дельта-компрессии состоит в том, чтобы обнаружить группы соседних пикселов, слабо отличающихся по цвету, и кодировать их цвет в виде опорного (reference) значения и отступлений от последнего (собственно, дельта). В Pascal появился алгоритм 4:1, работающий на еще более тонких градиентах, а также комбинированный режим 8:1, позволяющий взять два блока, сжатых по схеме 4:1 и отобразить в виде опорного значения и дельты между ними – что в итоге обеспечивает восьмикратное сжатие данных.
В сравнении GeForce GTX 980 и GTX 1080 эти меры обеспечивают эффективное увеличение ПСП на 20% поверх 40%, которые принес новый тип памяти с итоговым результатом в 70%. На скриншотах из Project: CARS фиолетовой заливкой отмечены пикселы, подвергшиеся компрессии на GPU семейств Maxwell и Pascal.
Важна именно Пропускная Способность подсистемы Памяти (ПСП), она складывается не только из ширины шины, но и частоты работы памяти.
ПСП 192.2 Гб/с получена как произведение шины 192 бита (192/8=24 байта) на эффективную частоту 2002*4 МГц (для стандарта GDDR5 эффективная частота вчетверо выше реальной), получаем 24*8008=192.2 Гб/с.
Это как сравнивать 4-полоску с ограничением 60 км/ч и 2-полосную магистраль со 120 - пропускная способность будет сопоставимой и ее должно быть достаточно для данного конкретного участка и загруженности, так же как ПСП должно быть достаточно для подачи данных для обсчета на GPU в видеокартах. Если ее недостаточно - нужно либо увеличить разрешенную скорость (повысить частоту работы памяти), либо увеличить количество полос (увеличить битность шины), либо построить такую же параллельную дорогу (увеличить количество каналов памяти, актуально для RAM).
Другой бытовой пример: 10-летний 2.5V6 разгонит одну и ту же машину за то же время до сотки, что и современный турбовый 1.4, но расход будет несопоставим, как и энергопотребление у новых/старых видеокарт с одинаковой производительностью.
Поэтому выбирать видеокарты по одному этому параметру ширины шины некорректно, смотрите реальную производительность в тестах: вам же "ехать" а не "шашечки"?