Streitfall "Grafikspeicher": Nvidia geht mit nur 8 GiByte jetzt in die Offensive

260

News 19.05.2023 um 07:00 Uhr Sven Bauduin Als bevorzugte Quelle auf Google hinzufügen

Quelle: Nvidia

Während das Thema "Grafikspeicher" unter ambitionierten Spielern mehr und mehr zum Streitfall wird, geht der Hersteller angesichts seiner drei neuen Mittelklasse-Grafikkarten der Geforce-RTX-4060-Serie jetzt in die Offensive. Die hitzige Diskussion hatte neuerlich durch das Release der Geforce RTX 4060 Ti und der Geforce RTX 4060 deutlich an Fahrt aufgenommen.

Abseits der "großen" Geforce RTX 4060 Ti mit 16 GiByte, die mit einem nicht ganz so unwesentlichen Aufpreis von 110 Euro zur "beschnittenen" Geforce RTX 4060 Ti mit 8 GiByte durchaus teuer bezahlt werden muss, hat Nvidia seiner gesamten bisherigen Mittelklasse ein Side- oder gar Downgrade in Sachen Grafikspeicher verpasst. In Hersteller-Benchmarks hält sich der Leistungszuwachs im Hinblick auf pure Rasterleistung stark in Grenzen, weshalb einmal mehr DLSS 3 als neues Aushängeschild herhalten muss. Jetzt geht Nivida in die Offensive.

Nvidia erklärt Speicher, Cache und Subsystem

Ungeachtet der aktuellen Kritik am Speicherausbau seiner Mittelklasse-Grafikkarten hat der Hersteller sich jetzt dazu entschlossen, den Streitfall "Grafikspeicher" in einem sogenannten "Deep Dive" noch einmal näher zu thematisieren und so seine Sicht der Dinge darzulegen. Zudem erklärt Nvidia fundierten Anwendern auch gleich noch einmal freundlicherweise was ein sogenannter Grafikspeicher überhaupt ist.

Quelle: Nvidia Nvidia Geforce RTX 4000 ("Ada Lovelace")

Warum 8 GiByte für Nvidia kein Downgrade darstellen

Unter dem Titel "A Deeper Look At VRAM On GeForce RTX 40 Series Graphics Cards" erläutert Nvidia weshalb "8 GiByte" nicht automatisch gleich 8 GiByte sind und wie die moderne Architektur der Geforce RTX 4000 ("Ada Lovelace") und insbesondere deren im Vergleich zu den Geforce RTX 3000 ("Ampere") und Geforce RTX 2000 ("Turing") deutlich aufgebohrter L2-Cache dabei helfen, mit dem Grafikspeicher effizienter umzugehen. In den Spezifikationen lassen sich solche Down- und Sidegrade selbstverständlich nicht verbergen, die Praxis werden die Tests zeigen.

Cache und Speicher-Subsystem

Cache-Vorteile Speicher-Subsystem (alt) Speicher-Subsystem (neu)

Vollbild-Vergleich

Nvidia argumentiert, dass insbesondere der bei der Geforce RTX 4060 Ti im Vergleich zur Geforce RTX 3060 Ti von 4 auf jetzt 32 MiByte sowie bei der Geforce RTX 4060 im Vergleich zur Geforce RTX 3060 von 3 auf jetzt 24 MiByte angewachsene L2-Cache und das optimierte Speicher-Subsystem die neue Generation nochmals deutlich effizienter mit dem zur Verfügung stehenden VRAM haushalten lässt.

Ihre Meinung ist gefragt!

Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren.

Quelle: Nvidia

Artikel teilen

Streitfall "Grafikspeicher": Nvidia geht mit nur 8 GiByte jetzt in die Offensive Während das Thema "Grafikspeicher" unter ambitionierten Spielern mehr und mehr zum Streitfall wird, geht der Hersteller angesichts seiner drei neuen Mittelklasse-Grafikkarten der Geforce-RTX-4060-Serie jetzt in die Offensive. Die hitzige Diskussion hatte neuerlich durch das Release der Geforce RTX 4060 Ti und der Geforce RTX 4060 deutlich an Fahrt aufgenommen.

Per E-Mail versenden

260

- Kommentare (260)
  Zur Diskussion im Forum
  
  Von Prozessorarchitektur Lötkolbengott/-göttin
  
  Das ganze gelaber von den L2 cahcxe ist Blödsinn
  Der Grund warum in manchen spielen die L2 cache helfen liegt nicht am cache sondern an der latenz des Speichers
  18gbps vs 14gbps sind 1,22ns vs 1,57ns =1,28fach beschleunigt Annahme von cl 22
  Spiele sind was bandbreite Anforderung anbelangt eher Undurchsichtig mal reicht es, mal nicht
  Am deutlichsten wird das bei höheren Auflösungen .
  Da geht nicht nur der vram bedarf hoch sondern auch die fps runter auch wenn die 8gb reichen.
  Wie man das am besten darstellen kann indem man spiele nimmt die hohe bandbreite benötigen und wenig vram
  das muss aber erst herausgefunden werden was bei rtx3060ti vs rtx4060ti aber gut möglich ist .
  Kleiner Nebeneffekt der durch die quasi identische rasterleistung und vram menge darstellt.
  
  Nvidia gibt fp16 Leistung an bei floating point nicht fp32 theoretisch wäre es möglich wenn es keine fp16 Berechnungen gäbe aber die gibt es immer in spielen.
  Dazu das CPu limit das greifen wird.
  Daher meine Formel
  ada sowie ampere haben 64 fp32 +32 int32 fp32 hybrid +32 int32 alu
  =
  64 fp32 dediziert
  32 int32 fp32 hybrid (treibergesteuert) davon 16 fp32 definitiv aktiv
  32 int32 deditiert
  
  Daraus folgt 80 fp32 liegen immer an + 8-16 fp32 wenn kein fp16 anliegt
  Also maxed 88 fp32 pro sm
  Sofern kein cpu limit, kein bandbreiten limit und kein rop limit vorliegt
  Vram menge spielt auch ne rolle
  
  Ob man nvidia fp32 Zahlen niimmt oder meine Formel ist egal da ada und ampere identisch sind.
  Wie könnte nvidis das lösen?
  Nun statt 18gbps sollte sie 24gbps gddr6x nehmen diese auf 22gbps limitieren
  Dann nur das 16gb Modell. (neues pcb mt 8 Steckplätzen)
  Den ad106 Vollausbau 36sm
  Und zuletzt 440€ als rtx4060 super
  
  Eventuell wird das die rtx5060 q1 2024
  
  Zitieren
  
  Von Prozessorarchitektur Lötkolbengott/-göttin
  
  Das ganze gelaber von den L2 cahcxe ist Blödsinn
  Der Grund warum in manchen spielen die L2 cache helfen liegt nicht am cache sondern an der latenz des Speichers
  18gbps vs 14gbps sind 1,22ns vs 1,57ns =1,28fach beschleunigt Annahme von cl 22
  Spiele sind was bandbreite Anforderung anbelangt eher Undurchsichtig mal reicht es, mal nicht
  Am deutlichsten wird das bei höheren Auflösungen .
  Da geht nicht nur der vram bedarf hoch sondern auch die fps runter auch wenn die 8gb reichen.
  Wie man das am besten darstellen kann indem man spiele nimmt die hohe bandbreite benötigen und wenig vram
  das muss aber erst herausgefunden werden was bei rtx3060ti vs rtx4060ti aber gut möglich ist .
  Kleiner Nebeneffekt der durch die quasi identische rasterleistung und vram menge darstellt.
  
  Nvidia gibt fp16 Leistung an bei floating point nicht fp32 theoretisch wäre es möglich wenn es keine fp16 Berechnungen gäbe aber die gibt es immer in spielen.
  Dazu das CPu limit das greifen wird.
  Daher meine Formel
  ada sowie ampere haben 64 fp32 +32 int32 fp32 hybrid +32 int32 alu
  =
  64 fp32 dediziert
  32 int32 fp32 hybrid (treibergesteuert) davon 16 fp32 definitiv aktiv
  32 int32 deditiert
  
  Daraus folgt 80 fp32 liegen immer an + 8-16 fp32 wenn kein fp16 anliegt
  Also maxed 88 fp32 pro sm
  Sofern kein cpu limit, kein bandbreiten limit und kein rop limit vorliegt
  Vram menge spielt auch ne rolle
  
  Ob man nvidia fp32 Zahlen niimmt oder meine Formel ist egal da ada und ampere identisch sind.
  Wie könnte nvidis das lösen?
  Nun statt 18gbps sollte sie 24gbps gddr6x nehmen diese auf 22gbps limitieren
  Dann nur das 16gb Modell. (neues pcb mt 8 Steckplätzen)
  Den ad106 Vollausbau 36sm
  Und zuletzt 440€ als rtx4060 super
  
  Eventuell wird das die rtx5060 q1 2024
  
  Zitieren
  
  Von Mironicus1337
  
  Zitat von vicares
  
  JEDER hat verstanden was die Folien sagen sollen,
  
  Wenn man des Lesens und Verstehens mächtig ist, dann beinhalten weder die Folien noch der Fließtext einen Hinweis darauf, dass der Cache den V-RAM Bedarf reduziert.
  
  Deine Aussagen sind folglich unwahr.
  
  Zitat von vicares
  
  In beiden Fällen, mein Lieber, ist mir die Zeit zu kostbar...
  
  Ausflüchte statt Fakten.
  
  Zitieren
  
  Von vicares Freizeitschrauber(in)
  
  Zitat von Mironicus1337
  
  Es gibt keine wundersame V-ram Vermehrung durch die wenigen mb cache.
  Es gibt nur mehr Effizienz und effektivere Ausnutzung der Bandbreite.
  
  Wieso zitierst du nicht den entsprechenden Ausschnitt? Wo ist er denn zu finden?
  Dürfte doch kein Problem sein.
  
  Ne, alles gut...
  
  JEDER hat verstanden was die Folien sagen sollen,
  nur Du willst es einfach nicht wahr haben,
  oder schnallst es wirklich nicht...
  
  In beiden Fällen, mein Lieber, ist mir die Zeit zu kostbar...
  
  Zitieren
  
  Von latiose88 BIOS-Overclocker(in)
  
  Gillt doch bei jeder Auflösung so. Auch full hd sinkt die VRAM last gegenüber des 1440p und so. Weiß zwar nicht wieviel VRAM man als Verbrauch insgesammt einspart aber 30 % gpu Anforderungen sinken dadurch dennoch wenn man full hd mit wqhd vergleicht und so. Bei höheren grafiksettings könnte es jedoch auch mehr sein. Oder halt bei kantenglättung kostet wqhd wohl auch nicht nur 30 % an Leistung. Ist halt wie man es vergleicht und was man als Standpunkt bzw Ausgangspunkt setzt.
  
  Beim video umwandeln spielt die Auflösung ja ebenso eine Rolle und beim wiedergeben spielt es ebenso eine Rolle welche Auflösung das Videos so halt hat.
  Also von daher ist dies ja auch klar.
  
  Zitieren
  
  Von Cyberdude77 Freizeitschrauber(in)
  
  Auch reduziert DLSS den Vram verbauch erheblich da Qualität nun einmal 1440p berechnet statt 2160p.
  
  Zitieren
  
  Direkt zum Diskussionsende

Hoch

Print / Abo

Apps

Die Redaktion Datenschutz Artikel-Archiv Datenschutz-Optionen Mediadaten Impressum Utiq verwalten Abo kündigen Vertrag widerrufen AGB Inhalt melden Newsletter