Geforce RTX 3090 Ti Founders Edition im Test: Nvidias 2-GHz-Referenzkarte punktet mit Effizienz
Die Geforce RTX 3090 Ti musste sich bereits im PCGH-Test beweisen, allerdings in Gestalt eines Custom-Designs. Nun ist Nvidias echte Referenzkarte (FE) an der Reihe, welche wir aus dem regulären Handel bezogen haben. Ob die Kalifornier damit die Effizienzmängel in den Griff bekommen und wie es um die Lautheit steht, lesen Sie im Folgenden.
In diesem Artikel
Mit der Geforce RTX 3090 Ti steht seit dem 29. März das ewige Ampere-Topmodell im Handel - die Architektur ist ausgereizt. Doch selbst nach dem umfassenden PCGH-Test der RTX 3090 Ti und den anschließenden Extrem-Benchmarks inklusive Overclocking und Undervolting blieb eine Frage offen: Wie verhält sich eine echte Referenzkarte? Wie versprochen, haben wir uns eine Founders Edition aus dem regulären Handel organisiert, denn eine Bemusterung seitens Nvidia fand nicht statt. Letzteres wirkt angesichts der nun gewonnenen Informationen wie eine verpasste Chance, denn die RTX 3090 Ti FE erweist sich in fast allen Punkten als leicht überlegen. In diesem Nachtest wiederholen wir alle Messungen mit der Founders Edition, ergänzen eine ausgedehnte Undervolting-Session und ziehen dann ein aktualisiertes Fazit mit erweitertem Wissen.
Zum Vorglühen eine kleine Erinnerung: Bei der Geforce RTX 3090 Ti handelt es sich um die einzige Gaming-Geforce auf Basis eines vollständigen aktiven GA102-Prozessors mit der Kennung "350". Diese warten nicht nur mit allen 84 Shader-Multiprozessoren und somit 10.752 FP32-ALUs auf, sondern auch mit hohem Takt. Die originale Geforce RTX 3090 musste sich mit einem leicht abgespeckten GA102 begnügen, konnte aber bereits auf das volle 384-Bit-Interface des Kerns zurückgreifen. Letzteres bietet auch die RTX 3090 Ti, selbstverständlich inklusive Mehrwert: Erstmals kommt GDDR6X-Speicher mit einer effektiven Datenrate von 21 Gigatransfers/s ("10.500 MHz") zum Einsatz. Damit nimmt die RTX 3090 Ti als erste Geforce die 1-TByte/s-Hürde und reiht sich neben der AMD Radeon VII ein.
Bildergalerie
Die ebenfalls stattliche Rechenleistung von rund 40 TFLOPS (FP32) wird nicht nur durch das kleine Einheitenplus gegenüber der RTX 3090 erreicht, sondern vor allem durch einen Takt-Boost: 1.860 MHz werden offiziell geboten, wobei die langjährige Erfahrung lehrt, dass das für die allermeisten Szenarien konservativ geschätzt ist und bestenfalls in Hochlastszenarien unterboten wird. Die RTX 3090 Ti verfügt somit auf dem Papier über 12,4 Prozent mehr Rechenleistung und einen um 7,7 Prozent höheren Speicherdurchsatz als die RTX 3090.
| Grafikkarte | RTX 3090 Ti | RTX 3090 | RTX 3080 Ti | RX 6900 XT LC | RX 6900 XT |
|---|---|---|---|---|---|
| Marktstart | 29.03.2022 | 24.09.2020 | 03.06.2021 | Q2 2021 (OEM) | 08.12.2020 |
| Architektur | Ampere | Ampere | Ampere | RDNA 2 | RDNA 2 |
| Codename/Konfektion | GA102-350 | GA102-300 | GA102-225 | Navi 21 XTXH | Navi 21 XTX |
| Chipgröße (reiner Die) | 628 mm² | 628 mm² | 628 mm² | 520 mm² | 520 mm² |
| Transistoren Grafikchip (Mio.) | 28.000 | 28.000 | 28.000 | 26.800 | 26.800 |
| Fertigungsverfahren (Foundry) | 8LPP (Samsung) | 8LPP (Samsung) | 8LPP (Samsung) | 7N (TSMC) | 7N (TSMC) |
| Shader-Cluster (CUs/SMs) | 84 | 82 | 80 | 80 | 80 |
| FP32-ALUs/TMUs/ROPs | 10.752/336/112 | 10.496/328/112 | 10.240/320/112 | 5.120/320/128 | 5.120/320/128 |
| Raytracing-Einheiten | 84 | 82 | 80 | 80 | 80 |
| Tensor-Kerne | 336 | 328 | 320 | - | - |
| Infinity Cache on-die (MiB) | - | - | - | 128 | 128 |
| GPU-Boost-Takt in Spielen (MHz) | 1.860 | 1.695 | 1.665 | 2.250 | 2.015 |
| FP16-Leistung ALUs (TFLOPS) | 40,0 | 35,6 | 34,1 | 46,1 | 41,3 |
| FP32/FP64-Leistung ALUs (TFLOPS) | 40,0/0,63 | 35,6/0,56 | 34,1/0,53 | 23,0/1,44 | 20,6/1,29 |
| Füllrate (Mtex/Mpix pro Sek.) | 625,0/208,3 | 556,0/189,8 | 532,8/186,5 | 720,0/288,0 | 644,8/257,9 |
| Größe des Level-2-Cache (KiB) | 6.144 | 6.144 | 6.144 | 4.096 | 4.096 |
| Speicheranbindung (Bit) | 384 | 384 | 384 | 256 | 256 |
| Geschwindigkeit RAM (GTs/MHz) | 21,0/10.502 | 19,5/9.752 | 19,0/9.502 | 18,4/9.200 | 16,0/8.000 |
| Speichertyp | GDDR6X | GDDR6X | GDDR6X | GDDR6 | GDDR6 |
| Transferrate Speicher (GB/s) | 1.008 | 936 | 912 | 589 | 512 |
| Speicherkapazität (MiB) | 24.576 | 24.576 | 12.288 | 16.384 | 16.384 |
| PCI-Express-Standard | 4.0 | 4.0 | 4.0 | 4.0 | 4.0 |
| PCI-Express-Stromanschlüsse | 1× 16-/3 × 8-Pol | 1× 12-/2× 8-Pol | 1× 12-/2× 8-Pol | 2× 8-Pol | 2× 8-Pol |
| Typische Leistungsaufnahme | 450 Watt | 350 Watt | 350 Watt | 350 Watt | 300 Watt |
| Unverbindlicher Preis (UVP) | 2.249 Euro | 1.649 Euro | 1.269 Euro | Keiner (nur OEM) | ~1.080 Euro |
Angaben der Leistung jeweils mit typischem GPU-Boost laut Hersteller. In der Praxis schwankt die Frequenz (in der Regel fällt sie höher aus) und somit auch der Durchsatz.
Nach vielen Stunden mit der Geforce RTX 3090 Ti Founders Edition können wir vermelden, dass es sich tatsächlich sogar um die erste Geforce-Referenzkarte handelt, die über eine breite Palette von Spielen und Auflösungen einen durchschnittlichen GPU-Boost von 2 GHz halten kann. Das hat sie nicht nur der strengen GPU-Selektion seitens Nvidia zu verdanken - auf der Ti kommen nur die besten GA102-Dies zum Einsatz -, sondern auch dem hohen Powerlimit von 450 Watt. Die erweiterten Leistungsaufnahmemessungen werden sogleich Aufschluss darüber geben, zunächst widmen wir uns der Gaming-Leistung.

[Ins Forum, um diesen Inhalt zu sehen]
Der RTX3090FE-Kühler hatte ein Gewicht von ca 2kg über 3 Slots für 350-400W TDP.
Bin schon gespannt, was die RTX4090 für ein Klopper wird, wenn der Kühler für 600W designt wird.
Müsste ja dann vom Dreisatz her ein 3kg-Kühler mit ≥4 Slots werden.
Naja, ist ja irrelevant. Hauptsache man kann AMD um 3FPS schlagen.
Und dann gibbet es immer noch diejenigen, welche solche immensen Verbräuche relativieren. Frei nach dem Motto, die leisten ja auch mehr und keiner daddelt an 24/7, zudem kann man ja UV betreiben...
MMn sollte auch PCGHX diese Entwicklung mehr anprangern. Oder wo landen wir dann, bei 1KW nur für die Pixelschubse
Gruß
Die Karte ist das genaue Gegenteil von Effizienz.
Die ganze Serie ist das Gegenteil von Effizienz.
Maxwell war mega effizient.
Pascal war effizient.
Turing war einigermaßen effizient, man ging aber schon ordentlich über die TGP.
Ampere ist nur noch Brechstange und mit UV (quasi Pflicht) noch gerade so zu bändigen.
Die RTX3090Ti holt ihre Leistung nur über die Leistungsaufnahme.
Wenn man ne RTX3090Ti undervoltet, dann hätte man auch ne RTX3090 übertakten können.
Kommt etwa aufs gleiche raus, nur kostet erstere 40% mehr.
Und Lovelace setzt allem Anschein nach nochmal ne fette Schippe drauf.
Bald werden die TGPs dann mit kW angegeben.
- https://extreme.pcgamesha...
- Email an betreffenden Fachredakteur ([Ins Forum, um diesen Inhalt zu sehen])
Daher: Back2topic bitte!