PCGH-Exklusiv: Eine mögliche Tera-FLOP-Karte von Nvidia

0
News Carsten Spille Als bevorzugte Quelle auf Google hinzufügen

PCGH-Exklusiv: Eine mögliche Tera-FLOP-Karte von Nvidia Quelle: (Bild: Nvidia) PCGH baut eine fiktive GPU: Wir bewegen uns hier auf rein spekulativem Gebiet - die Angaben können also stimmen, leicht von der Realität abweichen oder komplett falsch sein.

Basis:
- Nvidias G80-Architektur
- AMDs Angaben zur Verbesserung im 65-nm-Prozess

Ziele:
- Günstig zu fertigender Chip
- Performance mindestens auf 8800-GTS-Niveau
- Dual-Chip-Karte mit einem Teraflop/sek. möglich
- Performance-Mainstream wird bedient

Um Geforce-8800-GTS-Niveau in Sachen Performance bei einem gleichzeitig kleineren Chip zu erreichen, benötigen wir mindestens 64 Shader-ALUs bei 1,8 GHz. Gegen diese Möglichkeit sprechen zwei Dinge: Erstens bräuchten wir dann damit verbundene 16 Textureinheiten, die mit über 750 MHz laufen müssten und zweitens wollen wir einen kostensensitiven Chip fertigen, welcher ein wenig aufwändiges PCB (Printed-Circuit-Board) und eine möglichst kostengünstige Kühlung erfordert. Daher können wir den Prozess nicht bis an seine Grenzen treiben und das Maximum an Kernspannung ausreizen.

Alternativ wären 80 Shader-ALUs denkbar, die dann mit vergleichsweise gemächlichen 1,44 GHz laufen könnten, während die enthaltenen 20 TMUs (20 Adress- und 40 Filtereinheiten) mit etwa 650 MHz im weitaus vertretbareren Rahmen blieben. Alternativ wäre auch eine High-Performance-Variante mit höherem ALU-Takt von etwa 1,6 GHz denkbar.

Für das Dual-GPU-TFLOP-Monster bohren wir die bisher kaum für allgemeine Shader-Arbeit genutzte MUL-Einheit des G80 um ein ADD auf und erhalten - für GPGPU-Aufgaben ohne Perspektivenkorrektur - die doppelte MADD-Leistung . Eine GPU würde dann 80 ALUs *1.600 MHz *2 MADD* 2 FLOPs = 512 GFLOP/sek. Leisten können - zwei Chips schaffen dann das Tera-FLOP.

Für die Pixelausgabe sorgen 16 ROP-Einheiten (4 Quad-ROP-Partitionen), welche ein vierfach unterteiltes 256-Bit-Speichersystem bedingen. Mit einem Takt von 1.000 MHz GDDR3/4 wäre die Bandbreite der 8800 GTS von 64 Gigabyte pro Sekunde möglich.

Damit hätten wir bereits folgendes erreicht:

G80-GTS
AMD-Folie zum 65-Nanometer-Prozess (Bild: PCGH) Quelle: (Bild: PCGH) AMD-Folie zum 65-Nanometer-Prozess (Bild: PCGH) Shader-Leistung (MADD): 230,4 (345,6) GFLOP/sek. (inkl. Hilfseinheiten)
Textur-Leistung: 12,3/24,6 GTex./sek.
ROP-Durchsatz: 10,3 GPix./sek.
Speicherbus/-takt: 320/800 Bit/MHz
Speicherbandbreite: 64 GByte/sek.

Fiktiver PCGH-Chip
Shader-Leistung (MADD): 256,0 (512) GFLOP/sek. (inkl. Hilfseinheiten)
Textur-Leistung: 13/26 GTex./sek.
ROP-Durchsatz: 10,4 GPix./sek.
Speicherbus/-takt: 256/1.000 Bit/MHz
Speicherbandbreite: 64 GByte/sek.

Bildergalerie: Grafikkarten
Bild 1-3
Klicken Sie auf ein Bild, um die Bilderstrecke zu starten! (3 Bilder)

Artikel teilen

Per E-Mail versenden

0
  1. Seite 1 PCGH-Exklusiv: Eine mögliche Tera-FLOP-Karte von Nvidia
  • Print / Abo
    Apps
    PCGH Magazin 08/2026 PC Games 07/2026 play5 08/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk