Gainward GeForce RTX 3050 GHOST OC 8G (RECENZE)
	Je středa 26.1.2022 a přesně v 15.00 hodin tak končí embargo na informace kolem nových grafických karet GeForce RTX 3050 společnosti NVIDIA. Mě se na GPUreport dostalo hned několik těchto grafických karet, dnes bych vám ale jako první rád představil grafickou kartu Gainward RTX 3050 GHOST OC 8G.
	gpureport.cz Pavel Šantrůček 26.01.2022

OBSAH:

1. Architektura Ampere (GA106)	7. Porovnání provozních vlastností
2. Gainward RTX 3050 GHOST OC 8G	8. Porovnání výkonu
3. Gainward ExperTool II	9. Testy Raytracing a DLSS
4. Jak se testují grafické karty	10. Přetaktování
5. Testy provozních vlastností	11. Hodnocení
6. Zaostřeno na spotřebu

Architektura Ampere GA106

Name: Gainward RTX 3050 GHOST OC 8G
SKU: 299

Dříve, nežli si dnes grafickou kartu Gainward RTX 3050 GHOST OC 8G představíme a také řádně otestujeme, nebylo by asi od věci si grafický čip GA106 ve verzi GA106-150-A1, na kterém jsou založeny právě grafické karty GeForce RTX 3050, trochu popsat a osvětlit. A že to nebude nic složitého, o tom vás přesvědčím hnedle a budou mi k tomu stačit pouze tři bloková schémata grafického čipu GA106. Pojďme se na to tedy podívat.

Blokové schéma

Frontend

Stejně jako u předchozích generací, každý grafický čip musí nějaká data přijímat, následně rozdělovat úkoly a řídit práci podřízených jednotek. Tuto činnost má na starosti Frontend grafického čipu, který je již od dob architektury Fermi tvořen jednotkami Host Interface a GigaThread engine. Zatímco pomocí Host Interface jsou přenášeny příkazy z CPU pomocí PCI Express, Gigathread engine je zodpovědný za vlastní logiku přenosu dat z RAM do VRAM a především také za plánování a rozdělování práce na jednotlivé další podřízené jednotky. Vlastní řízení grafického čipu je pak práce velmi sofistikovaná a ne nepodobná práci CPU. Každý výrobce se tedy o bližší informace jen nerad dělí a nejinak tomu je právě v případě NVIDIA.

První změnou, které jsme se v generaci Ampere dočkali, je povýšení sběrnice PCI Express na výkonnější verzi PCIe 4.0. Toho mohou samozřejmě využít všichni majitelé základních desek právě s podporou PCIe 4.0 (v současnosti jen AMD Ryzen).

Graphics Processing Cluster (GPC)

V hierarchii blokového schéma je první podřízenou jednotkou Gigathread engine jednotka s názvem Graphics Processing Cluster, neboli GPC. Grafický čip GA106 se skládá celkem ze tří GPC, které mají obdobnou funkci jako Shader Array v konkurenční architektuře GCN. Kdo četl popis grafické pipeline, jistě již ví, že se jedná o jakousi kompletní grafickou pipeline, kde se primitiva přeměňují v pixely, ze kterých je pak složen celý hotový snímek a zobrazen na vašem monitoru.

GA104 Graphics Processing Cluster (GPC)

Každý GPC obsahuje jednu rasterizační jednotku (Raster engine), která spolupracuje s celkem 5 bloky TPC (Texture/Processor Cluster), ve kterých jsou sdruženy jednotky Polymorph Engine a vždy po dvou jednotkách Streaming Multiprocessors (SM).

Zatímco Polymorph Engine obsahuje fixní jednotky, které se starají o geometrii (Vertex Fetch, Tessellator, Stream Output atd.), SM jednotky jsou jednotkami naopak programovatelnými, na kterých je možné spouštět shadery (programy běžící na GPU).

Streaming Multiprocessor (SM)

GA104 Streaming Multiprocessor (SM)

Každá jednotka SM se (krom jiného) skládá ze čtyř bloků po 32 výpočetních jednotkách FP32 (CUDA Core), 16 jednotkách INT32 a jedné výpočetní jednotky Tensor Core třetí generace, určené pro tensor/maticové operace strojového učení. Všechny tyto bloky jsou pak propojeny přes sdílenou pamětí $L1 Data Cache (128KB).

Počet jednotek TMU (Texture Mapping Units), které využívají právě shadery k bezstarostnější práci s texturami, nebo raději 2D obrázky obecně, zůstal ve stejném počtu (4x TMU) a stejně tak je zde přítomna i jediná výpočetní jednotka RT Core, která je určena speciálně na výpočty Raytracingu, tedy na výpočty dráhy paprsku a detekci kolizí s 3D objekty scény.

Jak můžete vidět, právě v těchto výpočetních jednotkách došlo asi k té nejdramatičtější změně. Počet výpočetních jednotek FP32 (CUDA Cores) se nám totiž oproti generaci Turing zdvojnásobil. Má to však jeden háček, přidané jednotky FP32 sdílejí datapath (propojení) s jednotkami INT32, takže v jednom taktu mohou být využity buďto jednotky FP32 nebo jednotky INT32. Další změnou jsou pak výpočetní jednotky Tensor Cores, které by měly být v této třetí generaci 2x výkonnější, a stejně tak by měly být dvakrát výkonnější i výpočetní jednotky RT Cores druhé generace.

Spočítáme-li to dohromady, pak každá jednotka SM jako celek tedy disponuje 128x CUDA Cores, 4x Tensor Cores, 1x RT Core a 4x TMU. Pokud tedy GPC obsahuje celkem 5 bloků TPC, můžeme říci, že každý GPC obsahuje jeden rasterizér, 5x Polymorph Engine a 10x SM s 1280x CUDA Cores, 40x TMUs, 40x Tensor Cores a konečně také 10x RT Cores.

Každý GPC se může na vstupu postarat v jednom taktu o jeden primitivní trojúhelník (Triangle) a jeho výstupem jsou pak pixely, které je ale třeba ještě nějakým způsobem finalizovat (Blending, Z buffering atd.) a následně zapsat do framebufferu (Render Target). O tuto finalizaci a ukládání se starají jednotky s názvem Raster Operations Pipeline (ROP), které v generaci Ampere doznaly také změny a nyní jsou přímou součástí bloku GPC (u Turingu byly součástí framebufferu). Každý GPC obsahuje dva samostatné bloky po 8 ROPs, tedy celkem 16 ROPs, které se tedy umí postarat o 16 pixelů na takt.

Framebuffer (VRAM)

Grafický čip GA106 disponuje celkem šeti 32-bit řadiči paměti (192-bit celkem) a 3MB $L2 Cache. Paměťové řadiče jistě podporují nejnovější paměti typu GDDR6X, které byly vyvinuty v kooperaci se společností Micron a podporují technologii PAM4 (Pulse Amplitude Modulation-4), ale grafické karty GeForce RTX 3050 jsou ve finále vybaveny "jen" paměťmi typu GDDR6 o efektivní frekvenci 14000 MHz.

Pokud tedy víme, co vše obsahuje jeden blok GPC, vlastně si již sami můžeme spočítat, co obsahuje celý grafický čip GA106, který má v plné konfiguraci takovýchto GPC bloků celkem 3.

GPC: 3x
TPC: 15x
SM: 30x
CUDA Cores: 3 840x
Tensor Cores: 120x
RT Cores: 30x
TMUs: 120x
ROPs: 48x

Grafický čip GA106-150-A1 (GeForce RTX 3050)

Bohužel, grafická karta GeForce RTX 3050 na trh nepřichází s čipem v plné konfiguraci. Grafický čip GA106-150-A1 byl „oříznut“ o jeden blok GPC. Ve finále tak musíme ze specifikací odečíst 5x TPC s celkem 1280x Cuda Cores, 40x Tensor Cores, 10x RT Cores a 40x TMUs. Také byly odříznuty dva řadiče paměti. No a poslední změnou je pak u GeForce RTX 3050 využití pouze 8 datových linek na sběrnici PCI Express, oproti 16 linkám u grafické karty GeForce RTX 3060. Jak tedy vypadají konečné specifikace grafické karty GeForce RTX 3050?

SPECIFIKACE NVIDIA GEFORCE RTX 3050
	RTX 3060 Ti	RTX 3060	RTX 3050
Chip	GA104-200-A1	GA-106-300-A1	GA-106-150-A1
CUDA Cores	4864	3584	2560
RT Cores	30	28	20
Tensor Cores	152	112	80
TMUs	152	112	80
ROPs	80	48	32
Base Clock	1410 MHz	1320 MHz	1552 MHz
Boost Clock	1665 MHz	1777 MHz	1777 MHz
Memory Clock	14Gbps GDDR6	15Gbps GDDR6	14Gbps GDDR6
Memory Bus Width	256-bit	192-bit	128-bit
VRAM	8GB	12GB	8GB
TDP	200 W	170 W	130 W
Transistors	17.4B	13.25.6B	13.25.6B
Architecture	Ampere	Ampere	Ampere
Manufacturing Process	Samsung 8nm	Samsung 8nm	Samsung 8nm

Jak můžete vidět, oproti GeForce RTX 3060 je grafická karta GeForce RTX 3050 oříznuta nejen ve výpočetní části grafického čipu (méně CUDA, RT i Tensor cores), ale hlavně také na paměťovém subsystému (užší sběrnice, menší kapacita i frekvence VRAM). Dá se tedy předpokládat, že výkon nové grafické karty GeForce RTX 3050 bude o poznání nižší, nežli u grafické karty GeForce RTX 3060. Nepředbíhejme ale, to vše si dnes samozřejmě otestujeme.

Za zmínku také stojí další pokus společnosti NVIDIA o umělé snížení hashrate pro těžbu Etherea (a podobných kryptoměn). V případě grafických karet GeForce RTX 3050 je tento výkon uměle snížen na polovinu. Jak dlouho tato ochrana vydrží, či jestli těžaři nepřejdou na težbu jiné kryptoměny (jejíž hashrate není omezeno), to vše ukáže až čas. V každém případě, jak patrno, společnost NVIDIA se snaží touto grafickou kartou vyjít vstříc zejména všem hráčům počítačových her a to se musí ocenit.

Ampere a nové technologie

Grafické karty GeForce RTX 30 přinášejí také nějaké nové technologie, i když to samozřejmě není nic tak přelomového, jako tomu bylo v případě grafických karet Turing, které s sebou přinesly jako první podporu výpočtů real-time raytracingu a DLSS (Deep Lerning Super Sampling). Ať už se ale jedná o technologie nové či starší věřte, že grafické karty generace Ampere jsou na budoucích pár let hraní vybaveny velmi dobře. Tady je takový stručný výpis toho, s čím budete moci u grafických karet Ampere počítat:

úplná podpora DirectX 12 Ultimate (Ray-tracing, VRS, Mesh shader, sampler Feedback)
podpora DLSS (proprietární technologie NVIDIA )
hardwarová akcelerace RT Motion blur (novinka v RT)
Simultaneous Compute and Graphics (SCG) - souběžné zpracování Graphics + RT + DLSS operací
RTX IO (podpora Microsoft DirectStorage)
HDMI 2.1 (přednos signálu až 8K/60Hz)
DisplayPort 1.4a (přednos signálu až 8K/60Hz)
NVDEC (s podporou formátů HEVC, VP9, H264 a AV1)

Tak, to by bylo na úvod dnešní recenze asi vše a teď si již pojďme konečně představit grafickou kartu Gainward RTX 3050 GHOST 8G.


			Další kapitola

Hodnocení grafických karet

ze serveru Alza.cz

NVIDIA

GeForce RTX 5090 GeForce RTX 4090 GeForce RTX 5080 GeForce RTX 4080 SUPER GeForce RTX 5070 Ti GeForce RTX 4070 Ti SUPER GeForce RTX 5070 GeForce RTX 4070 SUPER GeForce RTX 4070 GeForce RTX 5060 Ti GeForce RTX 5060 GeForce RTX 4060 Ti GeForce RTX 4060 GeForce RTX 3050

AMD

Radeon RX 7900 XTX Radeon RX 9070 XT Radeon RX 7900 XT Radeon RX 9070 Radeon RX 7900 GRE Radeon RX 7800 XT Radeon RX 7700 XT Radeon RX 9060 XT Radeon RX 7600 XT Radeon RX 7600

GPUreport