RTX Pro 5000: Blackwell-Grafikkarte kommt bald mit 72 GiB - als VRAM-Lückenfüller
Auf Nvidias Website wird eine weitere Variante der Workstation-Grafikkarte RTX Pro 5000 gelistet: Das Blackwell-Modell kommt auch mit 72 GiB auf den Markt. Damit wird die bislang klaffende Lücke zwischen 48 GiB und 96 GiB geschlossen.
Neben den hauseigenen Gaming-Grafikkarten und hochgezüchteten KI-Beschleunigern bietet Nvidia auch weiterhin Workstation-Grafikkarten an, die auf denselben Chips wie die Geforce-RTX-Modelle basieren. Auf Basis der aktuellen Blackwell-Architektur bietet Nvidia hier aktuell Varianten mit fünf unterschiedlichen GPUs an - von der RTX Pro 2000 Blackwell bis zur RTX Pro 6000 Blackwell. Und das zweitschnellste Modell, die RTX Pro 5000 Blackwell, kommt nun offenbar in einer weiteren Geschmacksrichtung.
Mehr Speicher, bleibender Abstand
Bislang wurde die Workstation-Grafikkarte von Nvidia immer nur mit 48 GiB GDDR7-Speicher beworben, während die schnellere RTX Pro 6000 über 96 GiB verfügt. Diese Lücke soll jetzt durch einen aufgebohrten Speicherausbau gefüllt werden: Die RTX Pro 5000 ist laut Nvidia künftig auch mit 72 GiB verfügbar. Wie groß der Aufpreis für dieses Upgrade ausfallen wird, ist dabei noch unklar. Technisch ändert sich an der Grafikkarte aber nicht allzu viel, die bislang verbauten 2-GiB-Chips werden wohl einfach durch Modelle mit 3 GiB ersetzt.
Während beim Speicherausbau damit eine Lücke geschlossen wird, bleibt bei der Rechenleistung weiterhin eine bestehen. Die RTX 5000 Pro setzt zwar auf Nvidias größten GB202-Chip, dieser wird aber auch in der neuen Variante nur stark beschnitten ausgeliefert. Erneut sind nur 14.080 Shader aktiviert, während die RTX 6000 Pro mit 24.064 Shadern fast den Vollausbau nutzt. Mit Blick auf die Rechenleistung bleibt das Workstation-Flaggschiff also wohl weiterhin deutlich vorne.
Ebenso spannend: GTX 2080 Ti: Weiterer Prototyp aufgetaucht - mit mehr Speicher und Recheneinheiten
Gleichzeitig wurde wohl auch das Speicherinterface erneut zurechtgestutzt: Nvidia nennt bei beiden Speichervarianten zwar 512 Bit, die Kapazitäten der RTX 5000 Pro sind aber nur mit einem 384-Bit-Interface möglich. Passend dazu ist auch die Bandbreite der RTX 5000 Pro niedriger, sie kann "nur" mit 1.344 GB/s auf ihren Speicher zugreifen, während die RTX 6000 Pro hier 1.792 GB/s bietet. Schlussendlich dürfte sich die neue RTX 5000 Pro mit 72 GiB VRAM damit vor allem für Kunden lohnen, bei denen in erster Linie die Speicherkapazität limitiert, nicht aber die Datenrate oder die Rechenleistung.
Mit welcher Anwendung haben Sie bis jetzt den meisten (V)RAM belegt? Nutzen Sie die Kommentarfunktion und teilen Sie uns Ihre Meinung mit. Zum Kommentieren müssten Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie noch keinen Account haben, könnten Sie über eine Registrierung nachdenken, die viele Vorteile mit sich bringt. Beachten Sie beim Kommentieren aber bitte die gültigen Forenregeln.
Quelle: Nvidia via Techpowerup

Ich kann nur raten die Grafikkarte zu undervolten oder ein vernünftiges Custom Modell zu kaufen. Kühlung ist alles.
wenn die Lüfter schon bei 50 °C angehen ist hingegen schon sehr ärgerlich.
Raff wird wohl kaum etwas unter ner Titan VI mit 128GB anfassen
Gruß,
Phil
Raff wird wohl kaum etwas unter ner Titan VI mit 128GB anfassen
Seit FLUX, QWEN und WAN2.1/2.2 ist der VRAM Bedarf nicht gerade gesunken.
Quantisierte GGUF-Modelle laufen auch mit kleinerem VRAM Speicher, allerdings dann mit Abstrichen in der Qualität.
Mit 24GB kann man noch gut FP8 Modelle verwenden, jedenfalls meistens...
Aber es stimmt schon, das 24GB schon knapp sind.
Die 5090 wurde nicht umsonst mit 32GB gelauncht. Sie soll eben (auch) genau diesen "Freizeit-Anwendern", welche die GPUs für lokale Modelle verwenden, schmackhaft machen.
9-11 Token sind ok und das wird erreicht im Hybrid Modus (CPU und GPU). Ein 32B Modell läuft dann recht flüssig. 64GB RAM vorausgesetzt.
KI ! LM Studio, ComfyUI, da sind 100% Auslastung ALLER GPU Ressourcen normal. Selbst meine 64GB RAM werden hier knapp.
Seit FLUX, QWEN und WAN2.1/2.2 ist der VRAM Bedarf nicht gerade gesunken.
Quantisierte GGUF-Modelle laufen auch mit kleinerem VRAM Speicher, allerdings dann mit Abstrichen in der Qualität.
Mit 24GB kann man noch gut FP8 Modelle verwenden, jedenfalls meistens...
Aber es stimmt schon, das 24GB schon knapp sind.
Die 5090 wurde nicht umsonst mit 32GB gelauncht. Sie soll eben (auch) genau diesen "Freizeit-Anwendern", welche die GPUs für lokale Modelle verwenden, schmackhaft machen.