Streitfall "Grafikspeicher": Nvidia geht mit nur 8 GiByte jetzt in die Offensive

260
News Sven Bauduin Als bevorzugte Quelle auf Google hinzufügen
Streitfall "Grafikspeicher": Nvidia geht mit nur 8 GiByte jetzt in die Offensive (1)
Quelle: Nvidia

Während das Thema "Grafikspeicher" unter ambitionierten Spielern mehr und mehr zum Streitfall wird, geht der Hersteller angesichts seiner drei neuen Mittelklasse-Grafikkarten der Geforce-RTX-4060-Serie jetzt in die Offensive. Die hitzige Diskussion hatte neuerlich durch das Release der Geforce RTX 4060 Ti und der Geforce RTX 4060 deutlich an Fahrt aufgenommen.

Abseits der "großen" Geforce RTX 4060 Ti mit 16 GiByte, die mit einem nicht ganz so unwesentlichen Aufpreis von 110 Euro zur "beschnittenen" Geforce RTX 4060 Ti mit 8 GiByte durchaus teuer bezahlt werden muss, hat Nvidia seiner gesamten bisherigen Mittelklasse ein Side- oder gar Downgrade in Sachen Grafikspeicher verpasst. In Hersteller-Benchmarks hält sich der Leistungszuwachs im Hinblick auf pure Rasterleistung stark in Grenzen, weshalb einmal mehr DLSS 3 als neues Aushängeschild herhalten muss. Jetzt geht Nivida in die Offensive.

Nvidia erklärt Speicher, Cache und Subsystem

Ungeachtet der aktuellen Kritik am Speicherausbau seiner Mittelklasse-Grafikkarten hat der Hersteller sich jetzt dazu entschlossen, den Streitfall "Grafikspeicher" in einem sogenannten "Deep Dive" noch einmal näher zu thematisieren und so seine Sicht der Dinge darzulegen. Zudem erklärt Nvidia fundierten Anwendern auch gleich noch einmal freundlicherweise was ein sogenannter Grafikspeicher überhaupt ist.

Nvidia Geforce RTX 4000 ('Ada Lovelace') Quelle: Nvidia Nvidia Geforce RTX 4000 ("Ada Lovelace")

Warum 8 GiByte für Nvidia kein Downgrade darstellen

Unter dem Titel "A Deeper Look At VRAM On GeForce RTX 40 Series Graphics Cards" erläutert Nvidia weshalb "8 GiByte" nicht automatisch gleich 8 GiByte sind und wie die moderne Architektur der Geforce RTX 4000 ("Ada Lovelace") und insbesondere deren im Vergleich zu den Geforce RTX 3000 ("Ampere") und Geforce RTX 2000 ("Turing") deutlich aufgebohrter L2-Cache dabei helfen, mit dem Grafikspeicher effizienter umzugehen. In den Spezifikationen lassen sich solche Down- und Sidegrade selbstverständlich nicht verbergen, die Praxis werden die Tests zeigen.

Nvidia argumentiert, dass insbesondere der bei der Geforce RTX 4060 Ti im Vergleich zur Geforce RTX 3060 Ti von 4 auf jetzt 32 MiByte sowie bei der Geforce RTX 4060 im Vergleich zur Geforce RTX 3060 von 3 auf jetzt 24 MiByte angewachsene L2-Cache und das optimierte Speicher-Subsystem die neue Generation nochmals deutlich effizienter mit dem zur Verfügung stehenden VRAM haushalten lässt.

Ihre Meinung ist gefragt!

Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren.

Quelle: Nvidia

260
    • Kommentare (260)

      Zur Diskussion im Forum
      • Von Prozessorarchitektur Lötkolbengott/-göttin
        Das ganze gelaber von den L2 cahcxe ist Blödsinn
        Der Grund warum in manchen spielen die L2 cache helfen liegt nicht am cache sondern an der latenz des Speichers
        18gbps vs 14gbps sind 1,22ns vs 1,57ns =1,28fach beschleunigt Annahme von cl 22
        Spiele sind was bandbreite Anforderung anbelangt eher Undurchsichtig mal reicht es, mal nicht
        Am deutlichsten wird das bei höheren Auflösungen .
        Da geht nicht nur der vram bedarf hoch sondern auch die fps runter auch wenn die 8gb reichen.
        Wie man das am besten darstellen kann indem man spiele nimmt die hohe bandbreite benötigen und wenig vram
        das muss aber erst herausgefunden werden was bei rtx3060ti vs rtx4060ti aber gut möglich ist .
        Kleiner Nebeneffekt der durch die quasi identische rasterleistung und vram menge darstellt.

        Nvidia gibt fp16 Leistung an bei floating point nicht fp32 theoretisch wäre es möglich wenn es keine fp16 Berechnungen gäbe aber die gibt es immer in spielen.
        Dazu das CPu limit das greifen wird.
        Daher meine Formel
        ada sowie ampere haben 64 fp32 +32 int32 fp32 hybrid +32 int32 alu
        =
        64 fp32 dediziert
        32 int32 fp32 hybrid (treibergesteuert) davon 16 fp32 definitiv aktiv
        32 int32 deditiert

        Daraus folgt 80 fp32 liegen immer an + 8-16 fp32 wenn kein fp16 anliegt
        Also maxed 88 fp32 pro sm
        Sofern kein cpu limit, kein bandbreiten limit und kein rop limit vorliegt
        Vram menge spielt auch ne rolle

        Ob man nvidia fp32 Zahlen niimmt oder meine Formel ist egal da ada und ampere identisch sind.
        Wie könnte nvidis das lösen?
        Nun statt 18gbps sollte sie 24gbps gddr6x nehmen diese auf 22gbps limitieren
        Dann nur das 16gb Modell. (neues pcb mt 8 Steckplätzen)
        Den ad106 Vollausbau 36sm
        Und zuletzt 440€ als rtx4060 super

        Eventuell wird das die rtx5060 q1 2024
      • Von Prozessorarchitektur Lötkolbengott/-göttin
        Das ganze gelaber von den L2 cahcxe ist Blödsinn
        Der Grund warum in manchen spielen die L2 cache helfen liegt nicht am cache sondern an der latenz des Speichers
        18gbps vs 14gbps sind 1,22ns vs 1,57ns =1,28fach beschleunigt Annahme von cl 22
        Spiele sind was bandbreite Anforderung anbelangt eher Undurchsichtig mal reicht es, mal nicht
        Am deutlichsten wird das bei höheren Auflösungen .
        Da geht nicht nur der vram bedarf hoch sondern auch die fps runter auch wenn die 8gb reichen.
        Wie man das am besten darstellen kann indem man spiele nimmt die hohe bandbreite benötigen und wenig vram
        das muss aber erst herausgefunden werden was bei rtx3060ti vs rtx4060ti aber gut möglich ist .
        Kleiner Nebeneffekt der durch die quasi identische rasterleistung und vram menge darstellt.

        Nvidia gibt fp16 Leistung an bei floating point nicht fp32 theoretisch wäre es möglich wenn es keine fp16 Berechnungen gäbe aber die gibt es immer in spielen.
        Dazu das CPu limit das greifen wird.
        Daher meine Formel
        ada sowie ampere haben 64 fp32 +32 int32 fp32 hybrid +32 int32 alu
        =
        64 fp32 dediziert
        32 int32 fp32 hybrid (treibergesteuert) davon 16 fp32 definitiv aktiv
        32 int32 deditiert

        Daraus folgt 80 fp32 liegen immer an + 8-16 fp32 wenn kein fp16 anliegt
        Also maxed 88 fp32 pro sm
        Sofern kein cpu limit, kein bandbreiten limit und kein rop limit vorliegt
        Vram menge spielt auch ne rolle

        Ob man nvidia fp32 Zahlen niimmt oder meine Formel ist egal da ada und ampere identisch sind.
        Wie könnte nvidis das lösen?
        Nun statt 18gbps sollte sie 24gbps gddr6x nehmen diese auf 22gbps limitieren
        Dann nur das 16gb Modell. (neues pcb mt 8 Steckplätzen)
        Den ad106 Vollausbau 36sm
        Und zuletzt 440€ als rtx4060 super

        Eventuell wird das die rtx5060 q1 2024
      • Von Mironicus1337
        Zitat von vicares
        JEDER hat verstanden was die Folien sagen sollen,
        Wenn man des Lesens und Verstehens mächtig ist, dann beinhalten weder die Folien noch der Fließtext einen Hinweis darauf, dass der Cache den V-RAM Bedarf reduziert.

        Deine Aussagen sind folglich unwahr.
        Zitat von vicares
        In beiden Fällen, mein Lieber, ist mir die Zeit zu kostbar...
        Ausflüchte statt Fakten.
      • Von vicares Freizeitschrauber(in)
        Zitat von Mironicus1337
        Es gibt keine wundersame V-ram Vermehrung durch die wenigen mb cache.
        Es gibt nur mehr Effizienz und effektivere Ausnutzung der Bandbreite.

        Wieso zitierst du nicht den entsprechenden Ausschnitt? Wo ist er denn zu finden?
        Dürfte doch kein Problem sein.
        Ne, alles gut...

        JEDER hat verstanden was die Folien sagen sollen,
        nur Du willst es einfach nicht wahr haben,
        oder schnallst es wirklich nicht...

        In beiden Fällen, mein Lieber, ist mir die Zeit zu kostbar...
      • Von latiose88 BIOS-Overclocker(in)
        Gillt doch bei jeder Auflösung so. Auch full hd sinkt die VRAM last gegenüber des 1440p und so. Weiß zwar nicht wieviel VRAM man als Verbrauch insgesammt einspart aber 30 % gpu Anforderungen sinken dadurch dennoch wenn man full hd mit wqhd vergleicht und so. Bei höheren grafiksettings könnte es jedoch auch mehr sein. Oder halt bei kantenglättung kostet wqhd wohl auch nicht nur 30 % an Leistung. Ist halt wie man es vergleicht und was man als Standpunkt bzw Ausgangspunkt setzt.

        Beim video umwandeln spielt die Auflösung ja ebenso eine Rolle und beim wiedergeben spielt es ebenso eine Rolle welche Auflösung das Videos so halt hat.
        Also von daher ist dies ja auch klar.
      • Von Cyberdude77 Freizeitschrauber(in)
        Auch reduziert DLSS den Vram verbauch erheblich da Qualität nun einmal 1440p berechnet statt 2160p.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 08/2026 PC Games 07/2026 play5 08/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk