Gigabyte
Grafické karty Ampere představeny!
Hotovo, dopečeno a nový Ampere byl Jensen Huangem vytažen z trouby. Tak nějak probíhal včerejší event, ve kterém nám byla představena nová generace grafických karet Ampere společnosti NVIDIA. No a my se dnes podíváme na to, co zajímavého můžeme od těchto nových grafických karet očekávat.
gpureport.cz  Pavel Šantrůček  02.09.2020

OBSAH:
1. Grafické karty NVIDIA Ampere představeny          
 

Grafické karty NVIDIA Ampere představeny

Dlouhé odpočítávání máme za sebou a tak jsme se na včerejším eventu k představení nových grafických karet Ampere společnosti NVIDIA mohli dozvědět konečně pár relevantních informací. Pravda, nebylo to nic podrobného, nicméně udělat si přesnější obrázek o tom, jak budou nové grafické karty Ampere vypadat, to myslím celkem stačilo.

Pro ty, kdo včera nestihli tento evente s Jensen Huagem (CEO a prezident NVIDIA), jsem se rozhodl video nalinkovat přímo sem a co možná nejsrozumitelnější formou popsat, co nás s příchodem grafických karet generace Ampere čeká a také nemine. Budu se však věnovat je ten nejzajímavějším věcem kolem architektury, informace kolem nových možností streamování a media creation tentokrát vynechám úplně.

 

NVIDIA GeForce RTX 30 Series | Official Launch Event

 

Dvojnásobný výpočetní výkon FP32

Ampere architecture

První velké překvapení se týkalo odhalení výpočetního výkonu Ampere, tedy přesněji počtu výpočetních jednotek FP32 (CUDA Core). Oproti spekulacím, které na veřejnosti kolovaly již nějaký ten pátek před touto událostí, jsme byli informování o tom, že počet CUDA Cores se nám u Ampere zdvojnásobil a výpočetní výkon FP32 se nám tak zvýšil na neuvěřitelných 36 TFLOPs u RTX 3090, 30 TFLOPs u RTX 3080 a 20 TFLOPs u RTX 3070! Jen připomínám, že současný high-end v podání RTX 2080 Ti disponuje výpočetním výkonem FP32 „jen“ kolem 13 TFLOPs.

Jak se to architektům Ampere povedlo? Inu bližší informace bohužel prozatím dostupné nejsou. Můžeme jen spekulovat o tom, že se vývojářům skutečně na čip podařilo vměstnat dvojnásobný počet výpočetních jednotek FP32, další možností pak je rozšíření výpočtů s přesností FP32 i na jiné (stávající) výpočetní jednotky, například jednotky INT32. Nejpravděpodobnější je pak kombinace obého, kdy skutečně došlo k fyzickému navýšení výpočetních jednotek FP32, avšak ty nejsou úplně dedikované a využívají konektivitu výpočetních jednotek INT32 (nemou být tedy využity současně). Však se to ale brzy dozvíme.

Nárůst výpočetního výkonu FP32 je tedy u Ampere ohromný a jeho využití pocítíte především ve zpracování grafických operací, tedy v počítačových hrách, které nás zajímají asi nejvíce. O nárůstu FPS však můžeme jen spekulovat. Výpočetní výkon totiž není vše a vyššímu výkonu ve hrách by mohl bránit například výkon jednotek ROP, které se zdají být organizované stejným způsobem jako v případě grafických karet Turing.

 

Jednotky RT a Tensor Cores

Ray-tracing a DLSS

Ray-tracing je klíčovým bodem zájmu společnosti NVIDIA a tak není divu, že se těmto jednotkám věnovalo hodně času. V případě Ampere tak byly představeny výpočetní jednotky RT druhé generace a Tensor Cores dokonce generace třetí. Víc podrobnějších informací popravdě nepadlo, snad jen to, že tyto výpočetní jednotky mohou pracovat souběžně s klasickými výpočty FP32, čímž se zkrátí doba potřebná pro rendering snímku. Výkon grafických karet Ampere v herních titulech podporující Ray-tracing a DLSS můžeme tedy očekávat vysoký, zřejmě dvojnásobný oproti stávajícím Turingům. To vše si však ještě samozřejmě změříme v recenzi.

 

Nové grafické paměti GDDR6X

GDDR6X

Grafické karty Ampere dostaly do vínku také nové grafické paměti typu GDDR6X, které byly vyvinuty v kooperaci se společností Micron a podporují technologii PAM4 (Pulse Amplitude Modulation-4). Právě díky technologii PAM4 může být přenášeno dvojnásobné množství dat při nižší spotřebě, ovšem také při nižší frekvenci. Ačkoliv Micron nabízí paměti GDDR6X o efektivní frekvenci až 21 GHz, u nejvyššího modelu GeForce RTX 3090 se dočkáme „pouhých“ 19,5 GHz. Oproti Turingům vzroste paměťová propustnost i tak o velmi pěkných bezmála 40%.

 

RTX IO (DirectStorage)

RTX IO

To co přichází (nebo teprve přijde) na nové konzole XBX (PS5 také), dorazilo také do Ampere, tedy podpora DirectStorage. O co se jedná? DirectStorage je nová technologie (API) Microsoftu, která umožňuje přímé a asynchronní (nezávislé) streamování dat z rychlých úložišť přímo do grafické karty a její VRAM.

V současnosti jsou veškerá data potřebná pro rendering hry přenášena více méně v kooperaci s procesorem. Procesor totiž musí přinejmenším tyto přenosy mezi úložištěm a GPU nějak iniciovat či ukončit, a pokud se jedná o data komprimovaná (například komprimované textury do hry), musí je také nejdříve dekomprimovat. To samozřejmě procesor zdržuje od jiných a důležitějších činností, jako je například příprava dalšího snímku pro grafickou kartu.

Technologie NVIDIA RTX IO podporuje toto nové API od Microsoftu a navíc umí sama provádět dekompresi dat na úrovni hardware GPU. Přenášeny jsou tak data v komprimované formě. Dočkat bychom se tak mohli například výrazného zkrácení načítání her, rozlehlejších herních světů s detailnějšími texturami či v neposlední řadě také méně obsazeného místa pro hry v našich úložištích.

V nejbližší době však tuto technologii asi ještě nevyužijeme. API DirectStorage ještě není vývojově dokončeno a dle vyjádření Microsoftu se toto API dostane k vývojářům her až někdy v příštím roce a do her samotných tedy samozřejmě ještě později. Další podmínkou pro efektivní fungování DirectStorage jsou pak rychlé NVMe SSD disky těch úplně posledních generací s velkou šířkou pásma. Na plotnové HDD zřejmě úplně zapomeňte.

 

Modely, specifikace a ceny

Následující tabulka sumarizuje to, co nyní o nových grafických kartách Ampere společnosti NVIDIA víme. Pokud vám nějaká informace v tabulce schází, bude kvůli NDA upřesněna později.

SPECIFIKACE
  RTX 3090 RTX 3080 RTX 3070 RTX 2080 Ti
Čip GA102 GA102 GA104 TU102
Tranzistory 28B 28B ? 18,6B
CUDA Cores 10496 8704 5888 4352
Frekvence (Boost) 1,7 GHz 1,71 GHz 1,73 GHz 1,545 GHz
Frekvence VRAM 19,5 Gbps 19 Gbps 16 Gbps 14 Gbps
VRAM 24 GB
GDDR6X
10 GB
GDDR6X
8 GB
GDDR6
11 GB
GDDR6
VRAM Bus 384 bit 320 bit 256 bit 352 bit
Výkon FP32 36 TFLOPs 30 TFLOPs 20 TFLOPs 13 TFLOPs
Výkon RT 69 TFLOPs 58 TFLOPs 40 TFLOPs ?
Výkon Tensor 285 TFLOPs 238 TFLOPs 163 TFLOPs 114 TFLOPs
TDP 350 W 320 W 220 W 250 W
Proces 8nm Samsung 8nm Samsung 8nm Samsung 12nm TSMC
Vydání 24.9.2020 17.9.2020 říjen 2020 20.9.2018
Cena 40 990,- 18990,- 13990,-  

 

Výkon

Informace o výkonu grafických karet Ampere v počítačových hrách nejsou prozatím veřejně dostupné, nicméně celkem slušný obrázek o výkonu si můžete udělat, pokud se podíváte na YouTube kanál DigitalFoundry. Video jsem zde samozřejmě nalinkoval také.

 

Nvidia GeForce RTX 3080 Early Look: Ampere Architecture Performance - Hands-On!

 

Pár informací ze zákulisí

V tomto týdnu proběhne briefing se společností NVIDIA, který bude určen výhradně pro „zvané“ a v něm se tedy dozvíme mnohem více podrobností o architektuře grafických karet Ampere. Posléze pak budou také pro testery uvolněny ovladače (drivery) a bude se tedy moci konečně začít testovat. Na výsledky testů si však budete muset opět počkat až do ukončení NDA.

         
 
         

 

SPONSORS & PARTNERS

Asus  Alza  MSI  Gigabyte
AMD  Sapphire  Asbis  EVGA  Nvidia

Copyright (c) 2019 InfoTrade Powered by ASP.NET & MS SQL Server