Wegen RX 7800 XT: Nvidia soll "sehr viele" RTX-4070-Super-GPUs produzieren lassen [Gerücht]
Die RTX 4070 Super steht als erste Grafikkarte des Nvidia-Refreshs vor der Tür - und soll insbesondere mit der Radeon RX 7800 XT in Konkurrenz treten. Hierfür soll auch die Produktion der "Super"-GPU deutlich nach oben geschraubt worden sein.
Nvidia läutet das Grafikkarten-Jahr 2024 mit dem "Super"-Refresh ein. Übereinstimmenden Berichten zufolge sollen die RTX 4070, RTX 4070 Ti und RTX 4080 jeweils neu aufgelegt werden. Den Anfang im Release-Zeitplan macht die RTX 4070 Super, die am 17. Januar 2024 das Licht der Welt erblicken soll - und dahinter steckt wettbewerbstechnisches Kalkül, wie der Youtube-Kanal Moore's Law is Dead wissen will.
Denn genau diese RTX 4070 Super werde von Nvidia in größeren Stückzahlen produziert und bilde den Hauptfokus des Refreshs. Ein naheliegender Grund hierfür sei demzufolge, dass es für den Hersteller vergleichsweise einfach sei, die RTX 4070 Super herzustellen: Man nehme einfach eine reguläre RTX 4070 Ti, beschneide den AD104-Chip ein wenig - fertig ist die RTX 4070 Super. Dazu passen auch die Gerüchte, wonach Nvidia die Produktion der RTX 4070 Ti (und RTX 4080) gänzlich im Zuge des Super-Refreshs einstellen möchte.
Ein anderer Punkt dürfte jedoch gewissermaßen für einen lichten Hoffnungsschimmer im GPU-Markt sorgen. Laut Moore's Law is Dead sieht Nvidia die RTX 4070 Super nämlich als direkten Konkurrenten zu AMDs Radeon RX 7800 XT, welche sich wie geschnitten Brot verkauft, wie nicht zuletzt die jüngsten Mindfactory-Verkaufszahlen belegen. Um dies bewerkstelligen zu können, müsse die neue Grafikkarte allerdings entweder deutlich besser sein oder diese mit einem kompetitiven Preis ausstatten - was wiederum potenziell zur Folge haben kann, dass AMD den Wettbewerb annimmt und die Preise der RX 7800 XT senkt.
RTX 4070 Super als Wettbewerbstreiber - Träumen erlaubt oder unvorstellbar? Wie schätzen Sie die vermeintlichen Nvidia-Pläne ein? Über die Kommentarfunktion können Sie uns Ihre Meinung mitteilen. Zum Kommentieren müssten Sie auf PCGH oder im Extreme-Forum eingeloggt sein. Sollten Sie noch keinen Account haben, könnten Sie über eine kostenlose Registrierung nachdenken, die viele Vorteile mit sich bringt. Beachten Sie beim Kommentieren aber bitte die Forenregeln.

Das ist eine komplette Gen, oder nicht?
Wieso paar Prozent?
Seit wann ist eine RTX 4090 genau so teuer wie eine 7900XTX?
Ich habe mich ausschließlich auf das gleiche Preisgefüge bezogen, es macht keinen Sinn Grafikkarten zu vergleichen die 1000€ Preisdifferenz haben. Somit ist die RTX 4090 aus dem Vergleich raus - bei der gilt nur wer mehr haben will muss mehr bezahlen.
Wenn man nur auf das oder das achtet, dann gilt das oder das.
Fragt sich nur wer heute noch auf Upscaler, FSR/DLSS und FSR FMF bzw. FG verzichten möchte? Die AMDler waren trotz starker Probleme von AFMF und FMF total begeistert, trotz FSR Zwang und jetzt wieder kein Upscaling nutzen?
Ganz schön wie ein Fähnchen im Wind.
Hat man beide Systeme nimmt man natürlich DLSS.
Das ist eine komplette Gen, oder nicht?
Wieso paar Prozent?
Nvidia stellt Werkzeuge wie das Power Capture Analysis Tool zur Verfügung und hatte vor langer Zeit mal einen Vortrag online mit dem Tenor: rechnen ist billig, kopieren ist teuer. Soll heißen, dass wenn ein Programm eine einzelnes Ergebnis ausrechnet, dann ist das billig und verbraucht wenig Energie. Was aber auch Energie und schaltenden Transistoren erfordert ist, dass Rechenaufgabe vom PCIe Bus entgegengenommen wird, bis zum Cuda Core gelangt und dann zurück an den PCIe Bus gegeben wird. Dieser "Kopiervorgang" bei dem eigentlich nichts berechnet wird ist "teuer", in dem Sinne, dass er bis zu 80% der Energie verbrauchen kann die der Gesamtprozess benötigt. Das wiederum ist ein Argument und der Hauptgrund, warum jede CPU und GPU diverse Formen von Cache haben, die so nahe wie möglich an den Rechenkernen ist. Mit Anylsetools gehen dann die Programmierer auf die Jagd ihren Code so zu optimieren, dass Vorgänge bei denen Daten kopiert werden so weit es geht beschränkt werden. Ein 50:50 Split für ein Spiel bei dem ständig Daten von der CPU über den PCIe Bus kommen ist als gutes Ergebnis zu betrachten. Wenn deine Nvidia also 250W frisst, dann gehen 125W in die Frames, der Rest geht an irgendwelche Kopiervorgänge.
Angenommen Nvidia und AMD hätten beide ein Multichipdesign bei dem alles in 5nm gefertigt wäre, dann wäre alles sehr ähnlich. Eine 200W Karte hätte 100W für rechnen und 100W für kopieren.
AMD hat jedoch einerseits einen Teil des Chips in 7nm gefertigt. Gerechnet wird immer noch mit 100W, aber anstatt 100W zum kopieren zu brauchen, benötigt der 7nm Chip des Designs keine 100W wie bei Nvidia, sondern 130W. Einfach nur weil er in 7nm gefertigt ist. Anschließend hat AMD sich gedacht: Infinitycache, wir brauchen mehr Speicher. Postiiv, weniger Kopiervorgänge über PCIe, Negativ trotzdem mehr Kopiervorgänge. Ohne AMD Entwicklerkit werden wir nur Schätzen könenn was das ausmacht. Zum Schluss drehen wir die Taktrate hoch und schon haben wir 100W mehr auf der Karte verbraucht. Weil nicht nur ist ein Teil unseres Chips in 7nm, sondern wir befeuern den auch noch extrahart, weil wir den Cache größer gemacht haben (schließlich ist 7nm auch billiger zu produzuieren).
Wenn man wissen will wie schnell die reine Karte ist, dann nimmt man am Besten Benchmarks mit CPU Minimallast wie Returnal. Das ist ein Spiel das total durchoptimiert ist, so gut es geht nur auf der GPU zu laufen. Da würde wirklich die Architektur gegeneinander antreten, Die Gegenprobe ist ein Spiel das viel CPU frisst, daran würde man sehen ob das generelle Chipdesign Flaschenhälse hat und ob die Kopiervorgänge eine AMD Karte ins TDP Limit treiben können. Imemr daran denken, wenn die Karte sagt bei 200W ist Schluss, dann ist bei 200W Schluss, wenn das Spiel so schlecht optimiert ist, dass 190W in Kopiervorgänge gehen, dann Pech gehabt.
Am besten sieht man den Unterschied bei Raytracing. Nvidia hat spezialisierte RT Kerne am Ende der Cudapipeline, da ist der Output vom Cuda gleich dem Input vom RT Core, was lästiges Kopieren spart. AMD macht das nicht, da gibt es nur allgemeine Kerne und der Otput von einem Kern muss erst wieder zurück in den Input, damit ein anderer Kern die nächste (RT) Operation mit dem Ergebnis ausführt.
TBP ist gut perf theoretisch auch aber die sku hat viel zu langsame vram Blöcke nötig wäre 24gbps ,dran sind 18gbps.Da helfen die 16gb vram auch nicht
vom preis ganz abgesehen
Derzeit P/L die rx7702xt aber bei viel zu hohen 245w tbp