PCGH-Exklusiv: Eine mögliche Tera-FLOP-Karte von Nvidia
Quelle: (Bild: Nvidia)
PCGH baut eine fiktive GPU: Wir bewegen uns hier auf rein spekulativem Gebiet - die Angaben können also stimmen, leicht von der Realität abweichen oder komplett falsch sein.
Basis:
- Nvidias G80-Architektur
- AMDs Angaben zur Verbesserung im 65-nm-Prozess
Ziele:
- Günstig zu fertigender Chip
- Performance mindestens auf 8800-GTS-Niveau
- Dual-Chip-Karte mit einem Teraflop/sek. möglich
- Performance-Mainstream wird bedient
Um Geforce-8800-GTS-Niveau in Sachen Performance bei einem gleichzeitig kleineren Chip zu erreichen, benötigen wir mindestens 64 Shader-ALUs bei 1,8 GHz. Gegen diese Möglichkeit sprechen zwei Dinge: Erstens bräuchten wir dann damit verbundene 16 Textureinheiten, die mit über 750 MHz laufen müssten und zweitens wollen wir einen kostensensitiven Chip fertigen, welcher ein wenig aufwändiges PCB (Printed-Circuit-Board) und eine möglichst kostengünstige Kühlung erfordert. Daher können wir den Prozess nicht bis an seine Grenzen treiben und das Maximum an Kernspannung ausreizen.
Alternativ wären 80 Shader-ALUs denkbar, die dann mit vergleichsweise gemächlichen 1,44 GHz laufen könnten, während die enthaltenen 20 TMUs (20 Adress- und 40 Filtereinheiten) mit etwa 650 MHz im weitaus vertretbareren Rahmen blieben. Alternativ wäre auch eine High-Performance-Variante mit höherem ALU-Takt von etwa 1,6 GHz denkbar.
Für das Dual-GPU-TFLOP-Monster bohren wir die bisher kaum für allgemeine Shader-Arbeit genutzte MUL-Einheit des G80 um ein ADD auf und erhalten - für GPGPU-Aufgaben ohne Perspektivenkorrektur - die doppelte MADD-Leistung . Eine GPU würde dann 80 ALUs *1.600 MHz *2 MADD* 2 FLOPs = 512 GFLOP/sek. Leisten können - zwei Chips schaffen dann das Tera-FLOP.
Für die Pixelausgabe sorgen 16 ROP-Einheiten (4 Quad-ROP-Partitionen), welche ein vierfach unterteiltes 256-Bit-Speichersystem bedingen. Mit einem Takt von 1.000 MHz GDDR3/4 wäre die Bandbreite der 8800 GTS von 64 Gigabyte pro Sekunde möglich.
Damit hätten wir bereits folgendes erreicht:
G80-GTS
Quelle: (Bild: PCGH)
AMD-Folie zum 65-Nanometer-Prozess (Bild: PCGH)
Shader-Leistung (MADD): 230,4 (345,6) GFLOP/sek. (inkl. Hilfseinheiten)
Textur-Leistung: 12,3/24,6 GTex./sek.
ROP-Durchsatz: 10,3 GPix./sek.
Speicherbus/-takt: 320/800 Bit/MHz
Speicherbandbreite: 64 GByte/sek.
Fiktiver PCGH-Chip
Shader-Leistung (MADD): 256,0 (512) GFLOP/sek. (inkl. Hilfseinheiten)
Textur-Leistung: 13/26 GTex./sek.
ROP-Durchsatz: 10,4 GPix./sek.
Speicherbus/-takt: 256/1.000 Bit/MHz
Speicherbandbreite: 64 GByte/sek.
