Nvidia Geforce RTX 4090 im Test: So powerful, it's kinda ridiculous! [Update]
Aktualisiert: Bis zu Leistungsfaktor 2 beim Rasterizing, Faktor 4 dank DLSS-3-Upsampling und verdoppelte Energie-Effizienz: Nvidia bewirbt seine neue Speerspitze Geforce RTX 4090 mit großer Selbstsicherheit. PCGH prüft im ausführlichen Test der RTX 4090, welche Errungenschaften die neue Ada-Lovelace-Architektur wirklich mitbringt.
In diesem Artikel
- Seite 1 Geforce RTX 4090 im Test: Spezifikation
- Seite 2 Geforce RTX 4090: Wichtiger Technik-Tauchgang
- Seite 3 Geforce RTX 4090 im Test: Benchmarks in 4 Auflösungen
- Seite 4 Geforce RTX 4090 im Test: Raytracing-Benchmarks
- Seite 5 Geforce RTX 4090 im Test: Lautheit, Verbrauch, Effizienz
- Seite 6 Geforce RTX 4090 im Test: Zusammenfassung mit Fazit
- Seite 7 Bildergalerie
Aktualisierung vom 12.10.2022: Wie angekündigt, haben Nvidia und seine Boardpartner heute den Verkauf der RTX 4090 (Founders Edition und Custom Designs) gestartet. Die Nachfrage war offenbar hoch, denn die interessanten Angebote, speziell die FE-ähnlichen Einsteiger-Designs für 1.949 Euro, waren sehr schnell ausverkauft. Mehr Details liefert der Liveticker zu den Angeboten. Der Launch war also bisher durchaus erfolgreich, auch wenn natürlich nicht klar ist, welche Menge die Shops zur Verfügung hatten. Falls Sie sich fragen, ob es die Founders von Nvidia auch zu kaufen gab: Wenn, dann nur wenige Sekunden oder Minuten, denn wir haben sie trotz F5-Drückens nur als "derzeit nicht verfügbar" erblickt.
Alle zwei Jahre ist es so weit: Eine neue Geforce-Generation erblickt das Licht der Welt. Heute fällt der offizielle Startschuss für "Ada Lovelace", mit der Nvidia die nunmehr dritte RTX-Generation einläutet. Im Gepäck haben die Kalifornier markige Versprechen rund um den größten Leistungssprung in der Firmengeschichte. Letztere sind, wie immer bei Launches, fantasievoll konstruiert, doch auch in der Realität ist die Geforce RTX 4090 mit großem Abstand die leistungsfähigste Gaming-Grafikkarte, welche PCGH je getestet hat. Im Folgenden verraten wir, was das 1.949-Euro-Schlachtschiff RTX 4090 bei klassischem Rasterizing und modernem Raytracing leistet, wie es um die Energie-Effizienz steht und welche Features sowie Fallstricke auf Interessenten warten.
Wichtiger Hinweis: Unsere Erfahrungen mit DLSS 3 (Grafikqualität und Benchmarks) bekommen Sie in einem mittlerweile veröffentlichten, zweiten Artikel zur RTX 4090.
Geforce RTX 4090 im Test: Next-Gen
Wir sind uns bewusst, dass sich die Bezeichnung "Next Generation" (nächste Generation) mit der Zeit abnutzt - im Falle der Geforce RTX 4090 ist sie jedoch angebracht. Erreicht wird der riesige Sprung nicht etwa durch einen radikal umgebauten Shader-Core, sondern durch eine so alte wie effektive Methode: AD102, Herz und Motor der Geforce RTX 4090, beherbergt nicht nur mehr Rechenwerke als sein Vorgänger GA102, sondern außerdem einen deutlich erhöhten Takt. Möglich wird dies durch eine signifikante Verbesserung der Fertigungstechnologie. Bei Ampere (Geforce RTX 30) setzte Nvidia vor zwei Jahren auf die Geschicke von Samsung, welche das "8N" genannte Verfahren bereitstellten. Der Prozess galt bereits im Jahr 2020 als zweite Wahl in den Disziplinen Packdichte und Taktpotenzial und somit als Ursache für die schwache Energie-Effizienz von Ampere sowie die relativ großen Grafikchips.
Bildergalerie
Für Ada Lovelace alias Geforce RTX 40 kehrt Nvidia "nach Hause" zum langjährigen Partner TSMC. Die taiwanische Chip-Schmiede bietet die fortschrittlichste Technologie an und wurde für die Fertigung aller Ada-Prozessoren verpflichtet. Im Falle von AD102 sowie seinen für November erwarteten Geschwistern AD103 sowie AD104 kommt eine "4N" genannte Custom-Version von TSMCs 5-Nanometer-Prozess zum Einsatz. Dank der signifikant kleineren Strukturbreite gegenüber Samsungs 8N kann Nvidia bei Ada Lovelace deutlich mehr Transistoren auf weniger Siliziumfläche unterbringen und im gleichen Atemzug die Taktraten um rund 50 Prozent steigern. Folgt man den offiziellen Zahlen zu Kerngröße und Transistormenge, so packt der AD102 mehr als 125 Millionen Schaltungen auf einen Quadratmillimeter, während es beim GA102 knapp 45 Millionen sind - eine Steigerung um Faktor 2,7. Bei den Vorgängern Turing (2018) und Pascal (2016) mit zeitgenössischer Fertigung waren es noch circa 25 Millionen Transistoren/mm². Werfen wir einen Blick auf alle leistungsrelevanten Parameter der Geforce RTX 4090 im Vergleich mit dem Besten der alten Garde:
| Grafikkarte | RTX 4090 | RTX 3090 Ti | RTX 3090 | RTX 3080 Ti | RX 6900 XT LC | RX 6900 XT |
|---|---|---|---|---|---|---|
| Marktstart | 12.10.2022 | 29.03.2022 | 24.09.2020 | 03.06.2021 | Q2 2021 (OEM) | 08.12.2020 |
| Architektur | Ada Lovelace | Ampere | Ampere | Ampere | RDNA 2 | RDNA 2 |
| Codename/Konfektion | AD102-300 | GA102-350 | GA102-300 | GA102-225 | Navi 21 XTXH | Navi 21 XTX |
| Chipgröße (reiner Die) | 608,5 mm² | 628,4 mm² | 628,4 mm² | 628,4 mm² | 520 mm² | 520 mm² |
| Transistoren Grafikchip (Mio.) | 76.300 | 28.300 | 28.300 | 28.300 | 26.800 | 26.800 |
| Fertigungsverfahren (Foundry) | 4N (TSMC) | 8N (Samsung) | 8N (Samsung) | 8N (Samsung) | N7 (TSMC) | N7 (TSMC) |
| Shader-Cluster (CUs/SMs) | 128 | 84 | 82 | 80 | 80 | 80 |
| FP32-ALUs/TMUs/ROPs | 16.384/512/176 | 10.752/336/112 | 10.496/328/112 | 10.240/320/112 | 5.120/320/128 | 5.120/320/128 |
| Raytracing-Einheiten | 128 (3. Gen.) | 84 (2. Gen) | 82 (2. Gen.) | 80 (2. Gen.) | 80 (1. Gen.) | 80 (1. Gen.) |
| Tensor-Kerne | 512 (4. Gen.) | 336 (3. Gen.) | 328 (3. Gen.) | 320 (3. Gen.) | - | - |
| Level-2-Cache (MiB) | 72 | 6 | 6 | 6 | 4 | 4 |
| Level-3-Cache (MiB) | - | - | - | - | 128 | 128 |
| GPU-Boost-Takt in Spielen (MHz) | 2.520 | 1.860 | 1.695 | 1.665 | 2.250 | 2.015 |
| FP16-Leistung ALUs (TFLOPS) | 82,6 | 40,0 | 35,6 | 34,1 | 46,1 | 41,3 |
| FP32/FP64-Leistung ALUs (TFLOPS) | 82,6/1,29 | 40,0/0,63 | 35,6/0,56 | 34,1/0,53 | 23,0/1,44 | 20,6/1,29 |
| Füllrate (Mtex/Mpix pro Sek.) | 1.290,2/443,5 | 625,0/208,3 | 556,0/189,8 | 532,8/186,5 | 720,0/288,0 | 644,8/257,9 |
| Optical Frame Accelerator (TOPS) | ~305 | ~126 | ~115 | ~113 | - | - |
| Speicheranbindung (Bit) | 384 | 384 | 384 | 384 | 256 | 256 |
| Geschwindigkeit RAM (GTs/MHz) | 21,0/10.502 | 21,0/10.502 | 19,5/9.752 | 19,0/9.502 | 18,4/9.200 | 16,0/8.000 |
| Speichertyp | GDDR6X | GDDR6X | GDDR6X | GDDR6X | GDDR6 | GDDR6 |
| Transferrate Speicher (GB/s) | 1.008 | 1.008 | 936 | 912 | 589 | 512 |
| Speicherkapazität (MiB) | 24.576 | 24.576 | 24.576 | 12.288 | 16.384 | 16.384 |
| PCI-Express-Standard | 4.0 | 4.0 | 4.0 | 4.0 | 4.0 | 4.0 |
| PCI-Express-Stromanschlüsse | 1× 16-/4× 8-Pol | 1× 16-/3× 8-Pol | 1× 12-/2× 8-Pol | 1× 12-/2× 8-Pol | 2× 8-Pol | 2× 8-Pol |
| Leistungsaufnahme (Board Power) | 450 Watt | 450 Watt | 350 Watt | 350 Watt | 350 Watt | 300 Watt |
| Unverbindlicher Launch-Preis (UVP) | 1.949 Euro | 2.249 Euro | 1.649 Euro | 1.269 Euro | Keiner (nur OEM) | ~1.080 Euro |
Angaben der Leistung jeweils mit typischem GPU-Boost laut Hersteller. Daten durch eigene Tests und Nachfrage bei AMD/Nvidia verifiziert. In der Praxis schwankt die Frequenz (in der Regel fällt sie höher aus) und daher auch der Durchsatz.
Auch lesenswert: Geforce RTX 4090 kaufen: Hier lässt sich Nvidias neue Top-Grafikkarte ab 12.10. bestellen
Wie Sie sehen, ist bei der Geforce RTX 4090 fast alles zahlreicher und schneller - die Leistungsaufnahme bleibt jedoch auf dem Niveau der RTX 3090 Ti. Letztere legte vor sechs Monaten die Messlatte nach oben und galt als Vorbereitung für Ada, was die Geforce RTX 4090 in Sachen Leistungsaufnahme, Kühlung und Platinendesign bestätigt - dazu gleich mehr.
Quelle: PC Games Hardware
Nvidia Geforce RTX 4090 Founders Edition: Spec Overview
Bei der theoretischen Rohleistung, welche stets ein Produkt aus Breite und Höhe (Einheitenmenge und Takt) ist, erreicht Nvidia mit offiziellen Taktraten mehr als den Faktor 2. Von diesem Sprung war die Geforce RTX 3090 gegenüber der RTX 2080 Ti abseits der reinen FP32-Leistung weit entfernt und hinzukommt, dass Takt erfahrungsgemäß besser in Leistung umgesetzt wird als zusätzliche Rechenwerke. Interessanterweise legt die Geforce RTX 4090 um exakt null Prozent zu, was die Leistung des Grafikspeichers angeht - ist das kein Bremsklotz? Grundsätzlich lautet die Antwort darauf "ja", sofern keine Maßnahmen in anderen Chip-Teilen unternommen werden - und diese hat Nvidia ergriffen: AD102 beinhaltet im Vollausbau 16× so viel Level-2-Zwischenspeicher wie GA102 - 96 anstelle von 6 MiByte.
Falls Sie das an AMDs Vorstoß mit dem "Infinity Cache" genannten Level-3-Zwischenspeicher innerhalb der RDNA-2-GPUs erinnert, sind Sie auf dem richtigen Dampfer. Hüben wie drüben hilft der große Zwischenspeicher dabei, wichtige Daten stets neben den Rechenwerken zu haben, anstelle den langen und energieintensiven Umweg Richtung Grafikspeicher zu gehen. Bedauerlicherweise nennt Nvidia auch auf mehrfache Nachfrage keine Zahlen zum GPU-internen Durchsatz und den Hit Rates (Erfolgsquote, etwas im Cache zu finden), allerdings lassen die Benchmarks auf eine sehr effiziente Lösung schließen. Sie sind zu Recht neugierig, doch bevor wir die Fps-Werte ausbreiten, widmen wir uns auf der nächsten Seite weiteren Features und Errungenschaften von Ada Lovelace.
- Seite 1 Geforce RTX 4090 im Test: Spezifikation
- Seite 2 Geforce RTX 4090: Wichtiger Technik-Tauchgang
- Seite 3 Geforce RTX 4090 im Test: Benchmarks in 4 Auflösungen
- Seite 4 Geforce RTX 4090 im Test: Raytracing-Benchmarks
- Seite 5 Geforce RTX 4090 im Test: Lautheit, Verbrauch, Effizienz
- Seite 6 Geforce RTX 4090 im Test: Zusammenfassung mit Fazit
