Grafické karty Ampere představeny!
	Hotovo, dopečeno a nový Ampere byl Jensen Huangem vytažen z trouby. Tak nějak probíhal včerejší event, ve kterém nám byla představena nová generace grafických karet Ampere společnosti NVIDIA. No a my se dnes podíváme na to, co zajímavého můžeme od těchto nových grafických karet očekávat.
	gpureport.cz Pavel Šantrůček 02.09.2020

OBSAH:

1. Grafické karty NVIDIA Ampere představeny

Grafické karty NVIDIA Ampere představeny

Dlouhé odpočítávání máme za sebou a tak jsme se na včerejším eventu k představení nových grafických karet Ampere společnosti NVIDIA mohli dozvědět konečně pár relevantních informací. Pravda, nebylo to nic podrobného, nicméně udělat si přesnější obrázek o tom, jak budou nové grafické karty Ampere vypadat, to myslím celkem stačilo.

Pro ty, kdo včera nestihli tento evente s Jensen Huagem (CEO a prezident NVIDIA), jsem se rozhodl video nalinkovat přímo sem a co možná nejsrozumitelnější formou popsat, co nás s příchodem grafických karet generace Ampere čeká a také nemine. Budu se však věnovat je ten nejzajímavějším věcem kolem architektury, informace kolem nových možností streamování a media creation tentokrát vynechám úplně.

NVIDIA GeForce RTX 30 Series | Official Launch Event

Dvojnásobný výpočetní výkon FP32

Ampere architecture

První velké překvapení se týkalo odhalení výpočetního výkonu Ampere, tedy přesněji počtu výpočetních jednotek FP32 (CUDA Core). Oproti spekulacím, které na veřejnosti kolovaly již nějaký ten pátek před touto událostí, jsme byli informování o tom, že počet CUDA Cores se nám u Ampere zdvojnásobil a výpočetní výkon FP32 se nám tak zvýšil na neuvěřitelných 36 TFLOPs u RTX 3090, 30 TFLOPs u RTX 3080 a 20 TFLOPs u RTX 3070! Jen připomínám, že současný high-end v podání RTX 2080 Ti disponuje výpočetním výkonem FP32 „jen“ kolem 13 TFLOPs.

Jak se to architektům Ampere povedlo? Inu bližší informace bohužel prozatím dostupné nejsou. Můžeme jen spekulovat o tom, že se vývojářům skutečně na čip podařilo vměstnat dvojnásobný počet výpočetních jednotek FP32, další možností pak je rozšíření výpočtů s přesností FP32 i na jiné (stávající) výpočetní jednotky, například jednotky INT32. Nejpravděpodobnější je pak kombinace obého, kdy skutečně došlo k fyzickému navýšení výpočetních jednotek FP32, avšak ty nejsou úplně dedikované a využívají konektivitu výpočetních jednotek INT32 (nemou být tedy využity současně). Však se to ale brzy dozvíme.

Nárůst výpočetního výkonu FP32 je tedy u Ampere ohromný a jeho využití pocítíte především ve zpracování grafických operací, tedy v počítačových hrách, které nás zajímají asi nejvíce. O nárůstu FPS však můžeme jen spekulovat. Výpočetní výkon totiž není vše a vyššímu výkonu ve hrách by mohl bránit například výkon jednotek ROP, které se zdají být organizované stejným způsobem jako v případě grafických karet Turing.

Jednotky RT a Tensor Cores

Ray-tracing a DLSS

Ray-tracing je klíčovým bodem zájmu společnosti NVIDIA a tak není divu, že se těmto jednotkám věnovalo hodně času. V případě Ampere tak byly představeny výpočetní jednotky RT druhé generace a Tensor Cores dokonce generace třetí. Víc podrobnějších informací popravdě nepadlo, snad jen to, že tyto výpočetní jednotky mohou pracovat souběžně s klasickými výpočty FP32, čímž se zkrátí doba potřebná pro rendering snímku. Výkon grafických karet Ampere v herních titulech podporující Ray-tracing a DLSS můžeme tedy očekávat vysoký, zřejmě dvojnásobný oproti stávajícím Turingům. To vše si však ještě samozřejmě změříme v recenzi.

Nové grafické paměti GDDR6X

GDDR6X

Grafické karty Ampere dostaly do vínku také nové grafické paměti typu GDDR6X, které byly vyvinuty v kooperaci se společností Micron a podporují technologii PAM4 (Pulse Amplitude Modulation-4). Právě díky technologii PAM4 může být přenášeno dvojnásobné množství dat při nižší spotřebě, ovšem také při nižší frekvenci. Ačkoliv Micron nabízí paměti GDDR6X o efektivní frekvenci až 21 GHz, u nejvyššího modelu GeForce RTX 3090 se dočkáme „pouhých“ 19,5 GHz. Oproti Turingům vzroste paměťová propustnost i tak o velmi pěkných bezmála 40%.

RTX IO (DirectStorage)

RTX IO

To co přichází (nebo teprve přijde) na nové konzole XBX (PS5 také), dorazilo také do Ampere, tedy podpora DirectStorage. O co se jedná? DirectStorage je nová technologie (API) Microsoftu, která umožňuje přímé a asynchronní (nezávislé) streamování dat z rychlých úložišť přímo do grafické karty a její VRAM.

V současnosti jsou veškerá data potřebná pro rendering hry přenášena více méně v kooperaci s procesorem. Procesor totiž musí přinejmenším tyto přenosy mezi úložištěm a GPU nějak iniciovat či ukončit, a pokud se jedná o data komprimovaná (například komprimované textury do hry), musí je také nejdříve dekomprimovat. To samozřejmě procesor zdržuje od jiných a důležitějších činností, jako je například příprava dalšího snímku pro grafickou kartu.

Technologie NVIDIA RTX IO podporuje toto nové API od Microsoftu a navíc umí sama provádět dekompresi dat na úrovni hardware GPU. Přenášeny jsou tak data v komprimované formě. Dočkat bychom se tak mohli například výrazného zkrácení načítání her, rozlehlejších herních světů s detailnějšími texturami či v neposlední řadě také méně obsazeného místa pro hry v našich úložištích.

V nejbližší době však tuto technologii asi ještě nevyužijeme. API DirectStorage ještě není vývojově dokončeno a dle vyjádření Microsoftu se toto API dostane k vývojářům her až někdy v příštím roce a do her samotných tedy samozřejmě ještě později. Další podmínkou pro efektivní fungování DirectStorage jsou pak rychlé NVMe SSD disky těch úplně posledních generací s velkou šířkou pásma. Na plotnové HDD zřejmě úplně zapomeňte.

Modely, specifikace a ceny

Následující tabulka sumarizuje to, co nyní o nových grafických kartách Ampere společnosti NVIDIA víme. Pokud vám nějaká informace v tabulce schází, bude kvůli NDA upřesněna později.

SPECIFIKACE
	RTX 3090	RTX 3080	RTX 3070	RTX 2080 Ti
Čip	GA102	GA102	GA104	TU102
Tranzistory	28B	28B	?	18,6B
CUDA Cores	10496	8704	5888	4352
Frekvence (Boost)	1,7 GHz	1,71 GHz	1,73 GHz	1,545 GHz
Frekvence VRAM	19,5 Gbps	19 Gbps	16 Gbps	14 Gbps
VRAM	24 GB GDDR6X	10 GB GDDR6X	8 GB GDDR6	11 GB GDDR6
VRAM Bus	384 bit	320 bit	256 bit	352 bit
Výkon FP32	36 TFLOPs	30 TFLOPs	20 TFLOPs	13 TFLOPs
Výkon RT	69 TFLOPs	58 TFLOPs	40 TFLOPs	?
Výkon Tensor	285 TFLOPs	238 TFLOPs	163 TFLOPs	114 TFLOPs
TDP	350 W	320 W	220 W	250 W
Proces	8nm Samsung	8nm Samsung	8nm Samsung	12nm TSMC
Vydání	24.9.2020	17.9.2020	říjen 2020	20.9.2018
Cena	40 990,-	18990,-	13990,-

Výkon

Informace o výkonu grafických karet Ampere v počítačových hrách nejsou prozatím veřejně dostupné, nicméně celkem slušný obrázek o výkonu si můžete udělat, pokud se podíváte na YouTube kanál DigitalFoundry. Video jsem zde samozřejmě nalinkoval také.

Nvidia GeForce RTX 3080 Early Look: Ampere Architecture Performance - Hands-On!

Pár informací ze zákulisí

V tomto týdnu proběhne briefing se společností NVIDIA, který bude určen výhradně pro „zvané“ a v něm se tedy dozvíme mnohem více podrobností o architektuře grafických karet Ampere. Posléze pak budou také pro testery uvolněny ovladače (drivery) a bude se tedy moci konečně začít testovat. Na výsledky testů si však budete muset opět počkat až do ukončení NDA.

Hodnocení grafických karet

ze serveru Alza.cz

NVIDIA

GeForce RTX 5090 GeForce RTX 4090 GeForce RTX 5080 GeForce RTX 4080 SUPER GeForce RTX 5070 Ti GeForce RTX 4070 Ti SUPER GeForce RTX 5070 GeForce RTX 4070 SUPER GeForce RTX 4070 GeForce RTX 5060 Ti GeForce RTX 5060 GeForce RTX 4060 Ti GeForce RTX 4060 GeForce RTX 3050

AMD

Radeon RX 7900 XTX Radeon RX 7900 XT Radeon RX 7900 GRE Radeon RX 7800 XT Radeon RX 7700 XT Radeon RX 9060 XT Radeon RX 7600 XT Radeon RX 7600

GPUreport