Asus Strix GTX 1660 Ti O6G Gaming: bez RTX a DLSS
	Další embargo na informace, tentokrát kolem grafických karet GeForce GTX 1660 Ti společnosti NVIDIA, právě padlo, a tak si dnes můžeme na GPUreport představit prvního zástupce z celé řady těchto nových grafických karet, kterým je Asus Strix GTX 1660 Ti O6G Gaming. Jak tedy tento Strix dopadl?
	gpureport.cz Pavel Šantrůček 22.02.2019

OBSAH:

1. Architektura Turing TU116 (400)	10. Far Cry 5
2. Asus Strix GTX 1660 Ti O6G Gaming	11. Strange Brigade
3. Asus GPU Tweak II	12. Shadow of the Tomb Raider
4. Jak testujeme grafické karty	13. Hitman 2
5. Testy provozních vlastností	14. Battlefield 5
6. Crysis 3	15. Teplota, hlučnost a spotřeba
7. Middle-earth: Shadow of War	16. Přetaktování
8. Assassin's Creed: Origins	17. Hodnocení
9. Wolfenstein II: The New Colossus	18. Příloha: videa Incredible Benchmarks

Architektura Turing TU116 (400)

Name: Asus Strix GTX 1660 Ti O6G Gaming
SKU: 146

Doposud všechny nově vydané grafické karty rodiny Turing společnosti NVIDIA, a to ať se jednalo o grafické karty ze segmentu vysokého výkonu (high-end) či středního výkonu (mainstream), vždy disponovaly podporou real-time raytracingu, a to díky přítomnosti speciálních výpočetních jednotek (RT Cores a Tensor Cores). V případě právě vydávaných grafických karet GeForce GTX 1660 Ti je tomu ale jinak, v nich totiž žádné jednotky RT Cores ani Tensor Cores nenaleznete (nebo jsou neaktivní) a je tak jasné, že s raytracingem či DLSS (Deep Learning SuperSampling) máte s těmito kartami prostě utrum.

Na premiérovou recenzi se mi na GPUreport dostala grafická karta Asus Strix GTX 1660 Ti O6G Gaming, ale dříve, nežli si ji představíme a také řádně otestujeme, nebylo by asi od věci si nejdříve grafický čip TU116, na kterém jsou postaveny všechny grafické karty GeForce GTX 1660 Ti, trochu popsat a osvětlit si, jak vůbec grafická karta GeForce GTX 1660 Ti ke svým specifikacím přišla. A jako obvykle, k obeznámení věcí kolem architektury tohoto čipu nám dobře poslouží zejména jeho blokové schéma, no a jistě nezbytných bude také trochu těch znalostí kolem grafické pipeline.

TU116-400-A1

Frontend

Stejně jako u předchozích generací, každý grafický čip musí nějaká data přijímat, následně rozdělovat úkoly a řídit práci podřízených jednotek. Tuto činnost má na starosti Frontend grafického čipu, který je již od dob architektury Fermi tvořen jednotkami Host Interface a GigaThread engine. Zatímco pomocí Host Interface jsou přenášeny příkazy z CPU pomocí PCI Express (PCIE 3.0), Gigathread engine je zodpovědný za vlastní logiku přenosu dat z RAM do VRAM a především také za plánování a rozdělování práce na jednotlivé další podřízené jednotky. Vlastní řízení čipu je práce velmi sofistikovaná a ne nepodobná práci CPU. Každý výrobce se tedy o bližší informace jen nerad dělí a nejinak tomu je právě v případě NVIDIA.

Graphics Processing Cluster (GPC)

V hierarchii blokového schéma je první podřízenou jednotkou Gigathread engine jednotka s názvem Graphics Processing Cluster, neboli GPC. Grafický čip TU116 se skládá z tří jednotek GPC. Kdo četl popis grafické pipeline, jistě již ví, že v případě GPC se jedná o jakousi kompletní grafickou pipeline, kde se primitiva přeměňují v pixely, ze kterých je pak složen celý hotový snímek a zobrazen na vašem monitoru.

TU116 GPC

Každý GPC tedy obsahuje jednu rasterizační jednotku (Raster engine), která spolupracuje s celkem 4 bloky TPC (Texture/Processor Cluster), ve kterých jsou sdruženy jednotky Polymorph Engine a vždy po dvou jednotkách Streaming Multiprocessors (SM).

Zatímco Polymorph Engine obsahuje fixní jednotky, které se starají o geometrii (Vertex Fetch, Tessellator, Stream Output atd.), SM jednotky jsou jednotkami naopak programovatelnými, na kterých je možné spouštět shadery (programy běžící na GPU).

Streaming Multiprocessor

SM TU116

Jednotky SM jsou základním stavebním kamenem architektury Turing. V případě TU116 se každá jednotka SM skládá (krom jiného) ze čtyř bloků po 16 výpočetních jednotkách FP32 (CUDA Core), registru, sdílené paměti, 64 KB L1 Cache a 4 jednotek TMU (Texture Mapping Units), které využívají právě shadery k bezstarostnější práci s texturami, nebo raději 2D obrázky obecně. Nově pak v SM každého Turingu naleznete také výpočetní jednotky typu INT32 pro práci s celočíselnými operacemi. RT Cores (pro výpočty dráhy paprsku a detekci kolizí s 3D objekty scény) a Tensor Cores (pro výpočty tensor/maticové operace strojového učení) zde ale bohužel chybí, nebo jsou deaktivovány (označeno červenou barvou).

Každá jednotka SM jako celek tedy disponuje 64x CUDA Cores, 64x INT32 Cores, které mohou být využity zároveň, a také 4x TMU. Pokud tedy GPC u TU116 obsahuje celkem 4 bloky TPC, můžeme říci, že každý GPC obsahuje jeden rasterizér, 4x Polymorph Engine a 8x SM s 512x CUDA Cores a 32x TMUs.

Každý GPC se může na vstupu postarat v jednom taktu o jeden primitivní trojúhelník (Triangle) a jeho výstupem jsou pak pixely, které je ale třeba ještě nějakým způsobem finalizovat (Blending, Z buffering atd.) a následně zapsat do framebufferu (Render Target). O tuto finalizaci a ukládání se starají jednotky s názvem Raster Operations Pipeline (ROP), které však součástí GPC nejsou. ROP jednotky jsou totiž u Turingu, stejně jako u předchozích generací, napojeny na paměťový subsystém framebufferu.

Framebuffer (VRAM)

Grafický čip TU116 disponuje celkem šesti 32-bit řadiči paměti (192bit celkem). Na každý paměťový řadič je navázáno 8x ROP jednotek a 256 KB L2 Cache, což v celku představuje 48 ROPs a 1536 KB L2 Cache. Paměťové řadiče podporují paměti typu GDDR6. Každá jednotka ROP se může v jednom taktu postarat o 1 pixel, což při celkovém počtu 48 ROPs představuje výkon 48 (32-bit) pixelů na takt.

Pokud tedy víme, co vše obsahuje jeden blok GPC, vlastně si již sami můžeme spočítat, co obsahuje celý grafický čip TU116, který má v plné konfiguraci takovýchto GPC bloků celkem 3.

GPC: 3
SM: 24
CUDA Cores: 1536
TMUs: 96
ROPs: 48

Jak tedy vypadají konečné specifikace grafické karty GeForce GTX 1660 Ti?

SPECIFIKACE NVIDIA GEFORCE GTX 1660 Ti
	RTX 2060	GTX 1660 Ti	GTX 1060
CUDA Cores	1920	1536	1280
RT Cores	30	0	0
Tensor Cores	240	0	0
TMUs	120	96	80
ROPs	48	48	48
Base Clock	1365 MHz	1500 MHz	1506 MHz
Boost Clock	1680** MHz	1770 MHz	1709 MHz
Memory Clock	14Gbps GDDR6	12Gbps GDDR6	8Gbps GDDR5
Memory Bus Width	192-bit	192-bit	192-bit
VRAM	6GB	6GB	6GB
TDP	160** W	120 W	120 W
Transistors	10.8B	6.6B	4.4B
Plocha	445 mm2	284 mm2	200 mm2
Architecture	Turing	Turing	Pascal
Manufacturing Process	TSMC 12nm FinFET	TSMC 12nm FinFET	TSCM 16nm FinFET
* reference ** founders

Jak můžete z tabulky vidět, GeForce GTX 1660 Ti je oproti předcházející generaci GeForce GTX 1060 znatelným výkonnostním skokem, zejména pak ve výpočetních operacích a propustnosti grafické paměti. Oproti GeForce RTX 2060 pak GTX 1660 Ti nepřišla jen o podporu výpočtů real-time raytracingu a strojového učení, ale také o trochu toho aritmetického výkonu a díky nižší frekvenci grafických pamětí také o trochu propustnosti VRAM.

Architektura Turing přináší také některé nové technologie. Krom reaĺ-time raytracingu, kterou však s Geforce GTX 1660 Ti využít nemůžete, přináší Turing především Mesh Shading, Variable Rate Shading, Texture-space Shading či Multi-view rendering. Z těch nových technologií, které se týkají spíše hardwarové části, je pak dobré zmínit zejména vylepšený NVENC. Tyto nové technologie jsme si již podrobněji popsali při uvedení grafické karty GeForce RTX 2080 v kapitole „Nové technologie Turingů“ a nemá tedy asi cenu vše znovu opakovat. Pojďme si raději grafickou kartu Asus Strix GTX 1660 Ti O6G Gaming pěkně představit.


			Další kapitola

Hodnocení grafických karet

ze serveru Alza.cz

NVIDIA

GeForce RTX 5090 GeForce RTX 4090 GeForce RTX 5080 GeForce RTX 4080 SUPER GeForce RTX 5070 Ti GeForce RTX 4070 Ti SUPER GeForce RTX 5070 GeForce RTX 4070 SUPER GeForce RTX 4070 GeForce RTX 5060 Ti GeForce RTX 5060 GeForce RTX 4060 Ti GeForce RTX 4060 GeForce RTX 3050

AMD

Radeon RX 7900 XTX Radeon RX 7900 XT Radeon RX 9070 Radeon RX 7900 GRE Radeon RX 7800 XT Radeon RX 7700 XT Radeon RX 9060 XT Radeon RX 7600 XT Radeon RX 7600

GPUreport