Geforce RTX 4060 im Benchmark-Test: Genügsam, günstig, gut?
Die Geforce RTX 4060 Ti 8GB ist Ihnen zu teuer, die Radeon RX 7600 zu stromdurstig? Ab dem 29. Juni startet ein neues Angebot: die Geforce RTX 4060. Nvidia bewirbt die Mittelklasse-Grafikkarte als ideales, effizientes Upgrade für ruckelgeplagte Nutzer älterer Grafikkarten. Ob die Geforce RTX 4060 ihre UVP von 329 Euro wert ist, klärt PCGH im XXL-Test.
In diesem Artikel
Full High Definition. Was der typische PCGH-Leser weder als "voll" noch "hoch" definiert, wird von Millionen PC-Spielern genutzt. Zumindest laut der neuesten Hard- und Software-Umfrage bei Steam nutzen rund drei Viertel der Gamer einen Full-HD-Bildschirm (oder geringer). Die Top-10-Liste der Grafikkarten passt dazu, ein Großteil der Steam-Nutzer zockt mit einer Geforce der Serien GTX 16, GTX 10 sowie 60er-Varianten von RTX 20 und RTX 30. Diese möchte Nvidia nun mit der Geforce RTX 4060 zum Aufrüsten motivieren - PCGH verrät im großen Test der 329-Euro-Grafikkarte, ob dieser Plan aufgeht. Falls Sie des Lesens überdrüssig sind, liefert Ihnen unser Testvideo zur Geforce RTX 4060 alle Informationen:
Geforce RTX 4060 im Test: Übersicht
Die Geforce RTX 4060 basiert auf dem neuen und kleinsten "Ada Lovelace"-Grafikchip, dem AD107, welcher das RTX-40-Funktionspaket in das 300-Euro-Segment bringt. Der jüngste Ada-Spross unterstreicht, dass Nvidia für jedes Preis- und Leistungssegment eine maßgeschneiderte Lösung entwickelt hat. Während die Geforce RTX 4060 Ti (PCGH-Test) mit dem nächstgrößeren Chip, dem AD106, noch Full HD mit maximalen Details bedienen soll, zielt die Geforce RTX 4060 etwas tiefer und damit direkt auf die Radeon RX 7600 (PCGH-Test): 1080p mit maßvoll reduzierten Details, auf Wunsch mit Raytracing und nach Möglichkeit mit Upscaling, ist das Einsatzgebiet.
Das Produkt ist genau auf diesen Korridor getrimmt. Dank eines 24 MiByte großen Level-2-Caches kann die RTX 4060 die wichtigsten Daten im Kern vorhalten, sodass die schmale 128-Bit-Speicheranbindung weniger schmerzt als bei vorherigen Geforce-Generationen, welche höchstens 6 MiByte L2-Cache aufweisen. Nvidia nennt eine effektive Speichertransferrate von 453 GByte/s für die RTX 4060 (real: 272 GByte/s), während die RTX 4060 Ti mit ihren 32 MiByte L2-Cache auf eine knappe Verdoppelung kommen soll (554 ggü. 288 GByte/s). Für Geeks möglicherweise spannend: Die Geforce RTX 4060 verfügt über so viel rasanten L1-Cache, wie die RTX 3060 an L2-Cache auffährt - 3 MiByte.
Quelle: Nvidia
Level-2-Cache als Bandbreitenkompensator (Daten beziehen sich auf RTX 4060 Ti, die RTX 4060 muss mit 24 MiB auskommen). Perfekt wäre beides: viel SRAM und viel DRAM-Transferrate.
Dass ein großer Zwischenspeicher Zugriffe auf den verhältnismäßig langsamen Grafikspeicher abfängt, ist Fakt - dennoch geht das Konzept nur bei maßvollen Datenmengen auf. Je größer die wichtigen Daten - etwa in höheren Auflösungen -, desto öfter muss auf den Grafikspeicher zurückgegriffen werden, was die Leistung senkt und die Leistungsaufnahme erhöht. Welche Praxisleistung Klein-Ada in Spielen erreicht, klären wir auf den folgenden Seiten. Die Geforce RTX 4060 im Vergleich mit anderen Mittelklasse-Grafikkarten; weitere Vergleichsmodelle finden Sie in unserer gepflegten GPU-Datenbank:
Auch lesenswert: RTX 4060 kaufen: Hier sind Chancen auf günstigste "Ada Lovelace"-Geforce am größten - erste Modelle ab 339 Euro
| Grafikkarte | Geforce RTX 4060 Ti 8GB | Geforce RTX 4060 | Geforce RTX 3060 12GB | Radeon RX 7600 | Arc A770 8GB |
|---|---|---|---|---|---|
| Marktstart | 24.05.2023 | 29.06.2023 | 25.02.2021 | 25.05.2023 | 12.10.2022 |
| Referenzkarte verfügbar? | Ja | Nein | Nein | Ja | Nein |
| Architektur | Ada Lovelace | Ada Lovelace | Ampere | RDNA 3 | Xe HPG |
| Codename/Konfektion | AD106-350 | AD107-400 | GA106-300 | Navi 33 XL | ACM-G10 |
| Chipgröße (mm²) | 187,8 | 158,7 | 276 | 204 | 406 |
| Transistoren Grafikchip (Mrd.) | 22,9 | 18,9 | 12,0 | 13,3 | 21,7 |
| Fertigung (Foundry) | 4N (TSMC) | 4N (TSMC) | 8N (Samsung) | N6 (TSMC) | N6 (TSMC) |
| Shader-Cluster (CUs/SMs) | 34 | 24 | 28 | 32 | 32 |
| FP32-ALUs/TMUs/ROPs | 4.352/136/48 | 3.072/96/48 | 3.584/112/48 | 2.048*/128/64 | 4.096/256/128 |
| Raytracing-Einheiten | 34 (3. Gen.) | 24 (3. Gen.) | 28 (2. Gen.) | 32 (2. Gen.) | 32 (1. Gen.) |
| Matrix-Einheiten | 136 (4. Gen.) | 96 (4. Gen.) | 112 (3. Gen.) | 64 (1. Gen.) | 512 (1. Gen.) |
| OFA für Frame Generation | Ja | Ja | Nein | Nein | Nein |
| Level-2-Cache (MiB) | 32 | 24 | 3 | 2 | 16 |
| Level-3-Cache (MiB) | – | – | – | 32 | – |
| Typ. GPU-Takt in Spielen (MHz) | 2.535 | 2.460 | 1.777 | 2.250 | 2.100 |
| FP16-Leistung ALUs (TFLOPS) | 22,1 | 15,1 | 12,7 | 36,9 | 17,2 |
| FP32-Leistung ALUs (TFLOPS) | 22,1 | 15,1 | 12,7 | 18,4 | 17,2 |
| Füllrate (Mtex/Mpix pro Sek.) | 344,8/121,7 | 236,2/118,1 | 199,0/85,3 | 288,0/144,0 | 537,6/268,8 |
| Speicheranbindung (Bit) | 128 | 128 | 192 | 128 | 256 |
| Geschwindigkeit RAM (GTs/MHz) | 18,0/9.000 | 17,0/8.500 | 15,0/7.500 | 18,0/9.000 | 16,0/8.000 |
| Speichertyp | GDDR6 | GDDR6 | GDDR6 | GDDR6 | GDDR6 |
| Transferrate Speicher (GB/s) | 288 | 272 | 360 | 288 | 512 |
| Speicherkapazität (MiB) | 8.192 | 8.192 | 12.288 | 8.192 | 8.192 |
| PCI-Express-Standard | 4.0 ×8 | 4.0 ×8 | 4.0 ×16 | 4.0 ×8 | 4.0 ×16 |
| PCI-Express-Stromanschlüsse | 1× 16-/1× 8-Pol | 1× 8-Pol | 1× 8-Pol | 1× 8-Pol | Je 1× 8-/1× 6-Pol |
| Leistungsaufnahme (Board Power) | 160 Watt | 115 Watt | 170 Watt | 165 Watt | 225 Watt |
| (Display-)Konnektivität | DP 1.4a, HDMI 2.1 | DP 1.4a, HDMI 2.1 | DP 1.4a, HDMI 2.1 | DP 2.1, HDMI 2.1 | DP 2.0, HDMI 2.1 |
| UVP zum Start (USD) | 399 | 299 | 329 | 269 | 329 |
| UVP zum Start (Euro) | 439 | 329 | 329 | 299 | 349 |
| €-Preis derzeit (Testzeitpunkt) | 400 | – | 280 | 275 | 280 |
Angaben der Leistung jeweils mit typischem GPU-Boost laut Hersteller. In der Praxis schwankt die Frequenz (in der Regel fällt sie höher aus) und daher auch der Durchsatz. *ALUs mit "Dual-Issue"-Fertigkeit, welche sich bestenfalls (!) verhalten wie die doppelte Anzahl.
Geforce RTX 4060: PCI-Regionalbahn
Neben dem schmalen Speicher-Interface weist die Geforce RTX 4060, wie bereits die Ti-Variante, eine weitere Flächenoptimierung auf, die bremsend wirkt: Der AD107 kommuniziert mit lediglich 8 PCI-Express-Lanes mit dem Host-System - wie auch die Radeon RX 7600 und 6600er-Geschwister. Dadurch halbiert sich die Transferrate zum Hauptspeicher und zurück. Betreibt man die Geforce RTX 4060 auf einem modernen Unterbau mit PCI-Express 4.0 ×8, ist das halb so wild, denn hier steht eine Transferrate äquivalent zu PCI-E 3.0 ×16 bereit. Wer jedoch ein älteres 3.0er-System aufrüsten möchte, sollte diesen Flaschenhals bedenken. Laut unseren Messungen stehen hier nur etwa 6,5 GByte/s zur Verfügung, während PCI-E 4.0 ×8 immerhin 12,5 GByte/s leistet - eine volle Anbindung, ab der Geforce RTX 4070 vorzufinden, erreicht 25 GByte/s.
Quelle: PC Games Hardware
PCI-Express Throughput aka PEG-Transferrate
Normalerweise sind 8 PCI-E-Lanes gemäß 4.0-Standard kein Spielverderber. In Kombination mit 8 GiByte Speicher kann daraus jedoch ein Pferdefuß werden: Reicht der lokale Speicher der Grafikkarte nicht aus, müssen Daten über den PCI-Express aus dem Hauptspeicher kopiert werden. Dieser Vorgang ist selbst mit einer vollwertigen Anbindung sehr langsam, genügt aber bei moderaten Datenmengen, um Spiele am Laufen zu halten. Da 8 GiByte längst nicht in allen Situationen ausreichen und sich diese in Zukunft häufen werden, weist die Geforce RTX 4060 hier einen unnötigen Flaschenhals auf. Die für Juli angekündigte Geforce RTX 4060 Ti 16GB geht diesem Problem elegant aus dem Weg: 16 GiByte genügen unter allen Umständen, sodass keine Auslagerung stattfindet.
Wir arbeiten gegenwärtig an einem Artikel, der die Leistungsunterschiede zwischen PCI-Express 4.0 und 3.0 bei der Geforce RTX 4060 (Ti) umfassend beleuchtet. Bis dieser morgen, zum Marktstart der neuen Nvidia-Karte, erscheint, haben wir ein Beispiel für Sie erstellt. Zu sehen ist Spider-Man: Miles Morales in Full HD, mit maximalen Details inklusive DLAA und Frame Generation. Das Spiel streamt überdurchschnittlich viele Daten und füllt außerdem die 8 GiByte Speicher der Geforce RTX 4060, was einen Ernstfall simuliert. Die Ausschläge, gleichbedeutend mit Nachladerucklern, sind mit PCI-Express 3.0 wesentlich heftiger als mit PCI-E 4.0. Mehr dazu in Kürze.
Quelle: PC Games Hardware
Geforce RTX 4060: PCI-Express 4.0 vs. 3.0 in Spider-Man: Miles Morales
Sieht man von der Ausführungsgeschwindigkeit ab, sind die Ada-Grafikchips Feature-identisch. Alle GPUs werden bei der taiwanischen Chip-Schmiede TSMC im 4N-Prozess produziert, einer an Nvidia-Wünsche angepassten Variante von TSMCs 5-Nanometer-Fertigung. Neu gegenüber Geforce RTX 3000 alias Ampere sind unter anderem das KI-Upsampling DLSS 3 (enthält Frame Generation), diverse Architektur-Verbesserungen primär für das Raytracing sowie ein neuer NVENC, der das Aufnehmen von AV1-Videos (etwa mittels OBS) erlaubt. Bevor wir die zahlreichen Fps-Werte ausbreiten, widmen wir uns auf der nächsten Seite den Features und Errungenschaften von Ada Lovelace alias Geforce RTX 4000.

aber
[Ins Forum, um diesen Inhalt zu sehen]
[Ins Forum, um diesen Inhalt zu sehen]
Mit "korrekter" Powerregelung siehts im worstCase halt Anders aus.
... kaum besser als ne 2060, ... für den Preis!?
btw.
Bitte net vergessen, das in ollen PC`s@PCiE 3.0 auch noch ein paar Prozent flöten gehen.
Wenn das Ding nochmal 20 bis 30 Euro im Preis fällt, wäre das Angebot ganz okay.
Dann muss man auch die Kritik etwas zurückfahren.
Für das Geld bekommt man damit eine recht potente Karte.
Deine Anmerkung, dass die besten Chips in den Notebooks landen stimmt in der Regel, das ist ja üblich. Eine Einschränkung des Powerlimits und Untersuchung des Takts bzw. der Stabilität könnte da allerdings Klarheit verschaffen. Irgendwo mit muss man ja das Hochlabeln gerade im Desktopbereich rechtfertigen; das würde zumindest in Teilen die nicht gerade gelungene Produktpolitik von NVidia rechtfertigen.
Wie kommst du darauf, dass auf der RTX 4060 die Sahneteilchen der AD107-Fertigung zum Einsatz kommen? So weit ich weiß, kommt die GPU auch in Notebooks zum Einsatz - und zwar mit vollem Cache. Da im Mobilbereich die Energie-Effizienz besonders wichtig ist, würde ich hier die besten Exemplare vermuten. Wobei "beste" debattier- und selektierbar ist; möglicherweise pflanzt Nvidia die am höchsten taktbaren Chips auf die Grafikkarten. Das können wir von außen aber nicht bewerten. Und 3.072 FP32-ALUs sind auch mit 3,3 GHz (+10 % ausgehend vom realistischen Maximum) nur 3.072 FP32-ALUs. Vielleicht kriegt man mit 200+ Watt und 20 TFLOPS ja die Ti-Variante, aber mehr nicht.
MfG
Raff