Streitfall "Grafikspeicher": Nvidia geht mit nur 8 GiByte jetzt in die Offensive
Während das Thema "Grafikspeicher" unter ambitionierten Spielern mehr und mehr zum Streitfall wird, geht der Hersteller angesichts seiner drei neuen Mittelklasse-Grafikkarten der Geforce-RTX-4060-Serie jetzt in die Offensive. Die hitzige Diskussion hatte neuerlich durch das Release der Geforce RTX 4060 Ti und der Geforce RTX 4060 deutlich an Fahrt aufgenommen.
Abseits der "großen" Geforce RTX 4060 Ti mit 16 GiByte, die mit einem nicht ganz so unwesentlichen Aufpreis von 110 Euro zur "beschnittenen" Geforce RTX 4060 Ti mit 8 GiByte durchaus teuer bezahlt werden muss, hat Nvidia seiner gesamten bisherigen Mittelklasse ein Side- oder gar Downgrade in Sachen Grafikspeicher verpasst. In Hersteller-Benchmarks hält sich der Leistungszuwachs im Hinblick auf pure Rasterleistung stark in Grenzen, weshalb einmal mehr DLSS 3 als neues Aushängeschild herhalten muss. Jetzt geht Nivida in die Offensive.
Nvidia erklärt Speicher, Cache und Subsystem
Ungeachtet der aktuellen Kritik am Speicherausbau seiner Mittelklasse-Grafikkarten hat der Hersteller sich jetzt dazu entschlossen, den Streitfall "Grafikspeicher" in einem sogenannten "Deep Dive" noch einmal näher zu thematisieren und so seine Sicht der Dinge darzulegen. Zudem erklärt Nvidia fundierten Anwendern auch gleich noch einmal freundlicherweise was ein sogenannter Grafikspeicher überhaupt ist.
Quelle: Nvidia
Nvidia Geforce RTX 4000 ("Ada Lovelace")
Warum 8 GiByte für Nvidia kein Downgrade darstellen
Unter dem Titel "A Deeper Look At VRAM On GeForce RTX 40 Series Graphics Cards" erläutert Nvidia weshalb "8 GiByte" nicht automatisch gleich 8 GiByte sind und wie die moderne Architektur der Geforce RTX 4000 ("Ada Lovelace") und insbesondere deren im Vergleich zu den Geforce RTX 3000 ("Ampere") und Geforce RTX 2000 ("Turing") deutlich aufgebohrter L2-Cache dabei helfen, mit dem Grafikspeicher effizienter umzugehen. In den Spezifikationen lassen sich solche Down- und Sidegrade selbstverständlich nicht verbergen, die Praxis werden die Tests zeigen.
Nvidia argumentiert, dass insbesondere der bei der Geforce RTX 4060 Ti im Vergleich zur Geforce RTX 3060 Ti von 4 auf jetzt 32 MiByte sowie bei der Geforce RTX 4060 im Vergleich zur Geforce RTX 3060 von 3 auf jetzt 24 MiByte angewachsene L2-Cache und das optimierte Speicher-Subsystem die neue Generation nochmals deutlich effizienter mit dem zur Verfügung stehenden VRAM haushalten lässt.
Ihre Meinung ist gefragt!
Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren.
Quelle: Nvidia

Der Grund warum in manchen spielen die L2 cache helfen liegt nicht am cache sondern an der latenz des Speichers
18gbps vs 14gbps sind 1,22ns vs 1,57ns =1,28fach beschleunigt Annahme von cl 22
Spiele sind was bandbreite Anforderung anbelangt eher Undurchsichtig mal reicht es, mal nicht
Am deutlichsten wird das bei höheren Auflösungen .
Da geht nicht nur der vram bedarf hoch sondern auch die fps runter auch wenn die 8gb reichen.
Wie man das am besten darstellen kann indem man spiele nimmt die hohe bandbreite benötigen und wenig vram
das muss aber erst herausgefunden werden was bei rtx3060ti vs rtx4060ti aber gut möglich ist .
Kleiner Nebeneffekt der durch die quasi identische rasterleistung und vram menge darstellt.
Nvidia gibt fp16 Leistung an bei floating point nicht fp32 theoretisch wäre es möglich wenn es keine fp16 Berechnungen gäbe aber die gibt es immer in spielen.
Dazu das CPu limit das greifen wird.
Daher meine Formel
ada sowie ampere haben 64 fp32 +32 int32 fp32 hybrid +32 int32 alu
=
64 fp32 dediziert
32 int32 fp32 hybrid (treibergesteuert) davon 16 fp32 definitiv aktiv
32 int32 deditiert
Daraus folgt 80 fp32 liegen immer an + 8-16 fp32 wenn kein fp16 anliegt
Also maxed 88 fp32 pro sm
Sofern kein cpu limit, kein bandbreiten limit und kein rop limit vorliegt
Vram menge spielt auch ne rolle
Ob man nvidia fp32 Zahlen niimmt oder meine Formel ist egal da ada und ampere identisch sind.
Wie könnte nvidis das lösen?
Nun statt 18gbps sollte sie 24gbps gddr6x nehmen diese auf 22gbps limitieren
Dann nur das 16gb Modell. (neues pcb mt 8 Steckplätzen)
Den ad106 Vollausbau 36sm
Und zuletzt 440€ als rtx4060 super
Eventuell wird das die rtx5060 q1 2024
Deine Aussagen sind folglich unwahr.
Es gibt nur mehr Effizienz und effektivere Ausnutzung der Bandbreite.
Wieso zitierst du nicht den entsprechenden Ausschnitt? Wo ist er denn zu finden?
Dürfte doch kein Problem sein.
JEDER hat verstanden was die Folien sagen sollen,
nur Du willst es einfach nicht wahr haben,
oder schnallst es wirklich nicht...
In beiden Fällen, mein Lieber, ist mir die Zeit zu kostbar...
Beim video umwandeln spielt die Auflösung ja ebenso eine Rolle und beim wiedergeben spielt es ebenso eine Rolle welche Auflösung das Videos so halt hat.
Also von daher ist dies ja auch klar.