Nvidia GTX 1080 Ti FE: výkon který hned tak neomrzí!
Ačkoliv grafické karty rodiny Pascal společnosti Nvidia jsou tu s námi již nějaký ten pátek, na tu nejvýkonnější z nich jsme si přeci jen museli počkat trochu déle. Dnes je však tomuto čekání konec, protože GeForce GTX 1080 Ti je zde a to ve své plné kráse v podání Nvidia Founders Edition.
gpureport.cz  Pavel Šantrůček  09.03.2017

OBSAH:
1. Úvod - grafický čip GP102          
13. GTA V          
2. Nvidia GTX 1080 Ti Founders Edition          
14. The Witcher 3: Wild Hunt          
3. Jak budeme testovat          
15. Teplota, hlučnost a spotřeba          
4. Syntetické testy          
16. Přetaktování          
5. Metro Last Light          
17. Závěr          
6. Crysis 3          
18. Příloha - Star Wars: Battlefront          
7. Battlefield 4          
19. Příloha - Rise of the Tomb Raider          
8. Thief          
20. Příloha - Ashes of the Singularity          
9. Middle Earth: Shadow of Mordor          
21. Příloha - Doom          
10. Alien: Isolation          
22. Příloha - Total War: Warhammer          
11. Far Cry 4          
23. Příloha - Deus Ex: Mankind Divided          
12. Dying Light          
24. Příloha - Battlefield 1          
 

Grafický čip GP102

Tím nejvýkonnějším, čím se rodina grafických karet generace Pascal společnosti Nvidia může ode dneška pochlubit, je grafická karta GeForce GTX 1080 Ti, která je založena na grafickém čipu GP102, známém spíše z profesionálních karet Titan X. Úpravou tohoto „Titánského“ grafického čipu pak vznikl čip nový s označením GP102-350-K1-A1, který je srdcem a motorem právě grafických karet GeForce GTX 1080 Ti. Pojďme si tedy tento „nový“ grafický čip nejdříve tak trochu představit.

My jsme si novou architekturu grafických čipů Pascal popsali v článku Asus Strix GTX 1070 O8G Gaming: Pascal ve velkém testu a proto asi nemá valného významu zde vše popisovat znovu. Zaměřím se proto dnes pouze na organizaci Graphics Processing Cluster (GPC), tedy na jednotky, ve kterých jsou jednotlivá 3D primitiva přeměňována na pixely 2D obrazu a jejich počet je tak přímo úměrný samotnému výkonu grafické karty.

 

GPCs Pascal

 

Jak můžete vidět, u grafického čipu GP102 nám počet jednotek GPC narostl na rovných 6 kousků, což je o 50 % více, nežli u dosavadního nejvýkonnějšího čipu GP104, na kterém jsou založeny grafické karty GeForce GTX 1080/1070. Znamená to tedy, že také grafická karta GeForce GTX 1080 Ti by měla být o 50 % výkonnější nežli GTX 1080? Čistě po teoretické stránce by tomu tak být mělo, ale samozřejmě je zde ještě mnoho faktorů, které se do konečného výkonu GTX 1080 Ti mohou promítnout také. Pojďme se tedy alespoň ve stručnosti nejdříve podívat do útrob samotné jednotky GPC.

 

GPC

 

Každý modul GPC se skládá vždy z jednoho rasterizéru a až 5 jednotek TPC (Texture/Processor Cluster). Zatímco rasterizér se stará o rasterizaci 3D objektů, kdy jsou 3D primitiva převáděna do ploché rastrové mřížky a vytvářeny fragmenty (bezbarevné pixely), úlohou TPC je pak těmto fragmentům přiřazení (vypočítání) té správné barvy.

Součástí každého bloku TPC je jednak fixní jednotka Polymorph Engine (PE), která se stará o věci jako je Vertech Fetch, teselaci apod. a nově také o funkcionalitu s názvem Simultaneous Multi-Projection, ale hlavně také jeden programovatelný výpočetní blok SM (Streaming Multiprocessors), který se stará o vlastní výpočty a práci s texturami.

 

Streaming Multiprocessor

 

Protože barva každého fragmentu se musí někde vzít a vypočítat, není asi moc velkým překvapením, že každá jednotka SM disponuje jednak vlastními výpočetními jednotkami s názvem CUDA Cores (CC) v celkovém počtu 128 CC (4x 32), na kterých běží vlastní programy s výpočty (shadery), ale disponuje také celkem 8 jednotkami TMU (Texture Mapping Units), které zase pro výpočty barev dodávají ty správné hodnoty Texelů (barev pixelů z textury).

Suma sumárum, pokud každá jednotka TPC obsahuje 1x PE, 128x CC a 8x TMU, pak jeden blok GPC s pěti TPC disponuje 5x PE, 640x CC a 40x TMU. Při celkovém počtu 6x GPC by grafický čip GP102 měl disponovat celkem 30x PE, 3840x CC a 240x TMU.

 

GP102 block scheme

 

Při pohledu na blokové schéma grafického čipu GP102-350-K1-A1 však zjistíme, že ne všechny bloky GPC jsou plně obsazeny a v některých nám nějaké jednotky TPC chybí. S největší pravděpodobností s ohledem na výtěžnost grafického čipu byly dvě jednotky TPC „obětovány“, takže konečné specifikace grafického čipu GP102-350-K1-A1 jsou 28x PE, 3584x CC, 224 TMU. To vše v šesti blocích GPC se šesti rasterizéry (16 pix), které zajišťují teoretickou geometrickou propustnost až 6 triangles na takt (96 pix/takt).

Při pohledu na počet paměťových řadičů je jasné, že pro vyšší výtěžnost nebyly „obětovány“ pouze dvě jednotky TPC, ale také jeden řadič paměti (32 bit), na který je navázáno nejen 1 GB grafické paměti, ale také 256 KB L2 Cache a 8 ROP (Raster Operations Pipeline) jednotek, o které tedy grafický čip GP102-350-K1-A1 definitivně přišel také. Na druhou stranu, pro kompenzaci nižšího počtu těchto jednotek paměťových operací byla grafická karta GeForce GTX 1080 Ti vybavena rychlejšími 11 Gbps grafickými paměťmi GDDR5X.

Projeví se ale vůbec nějak tyto lehké „řezy“ grafického čipu GP102 na výkonu GeForce GTX 1080 Ti? Osobně se domnívám, že nikoliv, snad jen v případě, kdy obě chybějící jednotky TPC spadnou do jediného bloku GPC by mohlo mít za následek nižší vytížení příslušných ROP jednotek. Myslím ale, že i tento výjimečně smolný případ by mohl mít poměrně nevýznamný dopad na celkový výkon této „nadupané“ grafické karty. Nyní se již pojďme podívat na finální specifikace grafické karty GeForce 1080 Ti.

 

Specifikace


GTX 1080 Ti GTX 1080 GTX 1070 GTX 980 Ti
Chip GP102 GP104 GP104 GM200
CUDA Cores 3584 2560 1920 2816
TMUs 224 160 120 176
ROPs 88 64 64 96
GPU Clock 1480 MHz 1607 MHz 1506 MHz 1000 MHz
Boost Clock 1582 MHz 1733 MHz 1683 MHz 1075 MHz
VRAM Clock 11Gbps
GDDR5X
10 Gbps
GDDR5X
8 Gbps
GDDR5
7 Gbps
GDDR5
VRAM Bus 352-bit 256-bit 256-bit 384-bit
TDP 250 W 180 W 150 W 250 W
Transistors 12B 7,2B 7,2B 8B
Process 16nm FinFET 16nm FinFET 16nm FinFET 28nm

Nové technologie, které s sebou architektura Pascal přinesla jako je podpora Asynchronních shaderů, Simultaneous Multi-Projection, Single Pass Stereo, Lens Matched Shading a Fast Sync, které jsme si popsali v našem předchozím článku, jsou samozřejmě platné také pro grafické karty GeForce GTX 1080 Ti a nám už tedy nezbývá nic jiného, nežli se pustit do dnešní recenze grafické karty Nvidia GTX 1080 Ti Founders Edition.

         
  Další kapitola