Geforce RTX 3080/3090: Fehlt den Grafikkarten Leistung?
Wccftech wundert sich in einem längeren Test, dass die neuen Grafikkarten Geforce RTX 3080 und RTX 3090 zwar sehr schnell, aber nicht so schnell sind, wie es die technischen Daten und die Verdopplung der TFLOPS eigentlich erwarten lassen.
Laut Wccftech ist bei den neuen Grafikkarten von Nvidia rund um die Geforce RTX 3080 nicht alles so, wie es scheint. Man weist aber darauf hin, dass man sich seine eigene Meinung zu der Analyse bilden sollte. Da Nvidia die doppelte Grafikleistung im Vergleich mit der Turing-Generation versprochen hatte, müsste die Shader-Leistung ohne Besonderheiten wie DLSS oder Raytracing doppelt so hoch sein.
Tatsächlich ist die Geforce RTX 3090 aber nur 30 bis 50 Prozent schneller als eine Geforce RTX 2080 Ti, obwohl diese weniger als die Hälfte der Shader-Einheiten hat. Irgendwo geht laut Wccftech also Leistung verloren. Die Webseite sieht hier drei Möglichkeiten. So könnten die Ampere-Shader Turing unterlegen sein und die FP32-TFLOPS würden gar nicht erreicht. Oder es gibt irgendwo Probleme im BIOS, Microcode oder den Low-Level-Treibern für die Grafikkarte. Ein weiterer Punkt wäre eventuell, dass die High-Level-Treiber, Spiele-Engines oder Software-Stacks nicht in der Lage sind, die vielen Shader-Einheiten von Ampere zu nutzen. Ein Test mit VRAY zeigt, dass die FP32-Leistung tatsächlich doppelt so hoch ist wie bei einer Geforce RTX 2080 Ti. Damit kann die erste Möglichkeit gestrichen werden. In Tests mit 11 Spielen zeigt sich jedoch, dass die Geforce RTX 3090 im Durchschnitt nur 33 Prozent schneller ist.
Des Pudels Kern
Ein Extra-Artikel nur für diese Erkenntnis? Tatsächlich wollen wir den neuen Artikel von Wccftech nutzen, um eine womöglich untergegangene Information in unseren Launch-Tests etwas prominenter zu platzieren. Bei der "fehlenden" Leistung der Ampere-Grafikkarten handelt es sich mit an Sicherheit grenzender Wahrscheinlichkeit weder um ein Hardware- noch um ein Software-Problem - zumindest nicht im klassischen Sinne. Wie wir bereits in den Standard- und Bonustests zur Geforce RTX 3080 und RTX 3090 ausführen, liegt die schwache Skalierung mit der FP32-Leistung an zwei Dingen. Erstens wurden im GA102 (und späteren GA104) nicht alle Ausführungseinheiten verdoppelt, sondern nur die FP32-Einheiten. Ein 1:1-Vergleich mit Turing ist ohnehin nicht möglich, da dieser zwar nicht über doppelt vorhandene FP32-ALUs pro Shader-Multiprozessor verfügt, jedoch über INT32-Einheiten, welche die Leistung in Spielen erhöhen und somit die Rechnung verwässern.
Das zweite Problem ist die Software in Gestalt der Spiele. Wie frühere "Shader-Monster" auch - zu nennen sind unter anderem AMDs Hawaii- und Fiji-Chips - benötigen GPUs mit vielen Arithmetik-Einheiten einen ordentlichen Input, um ausgelastet zu werden. Es ist deutlich schwieriger, einen Chip mit 8.704 FP32-ALUs (RTX 3080) auszulasten, als einen mit nur 4.352 ALUs (RTX 2080 Ti). Der Chip-interne Scheduler erreicht dieses Kunststück (wie bei Fiji & Co.) nur bei sehr komplexen Shader-Programmen. Hinzu kommt, dass Spiele längst nicht nur aus Gleitkomma-Berechnungen bestehen, wenngleich diese zunehmen. Insgesamt spielt die Zeit in Amperes Hände, denn wir stehen vor einer neuen Spiele-Genration. Eine Möglichkeit, schon vorher die Auslastung zu erhöhen, sind hohe Auflösungen. Dann fallen pro Objekt auch mehr Shader-Operationen an und die ALUs laufen zu keiner Zeit leer. Die Geometrie-Einheiten drehen hingegen öfter Däumchen. Wenn Sie genauer wissen möchten, für was sich Ampere abseits von Rendering eignet und wie PCGH die Zukunftstauglichkeit der Architektur einschätzt, studieren Sie am besten die Technik-Abhandlung sowie die Extrem-Benchmarks.

Dies alles saugt an der CPU aber eigentlich nicht an der GPU.
Allenfalls Videos schauen braucht ein bisschen Zusatzleistung. Aber die auch noch von der GPU.
Alles wird schneller, kleiner, und verbraucht weniger, so geht Star Trek. Mittlerweile können wir teilweise nicht einmal bei Zurück in Zukunft mithalten.
Die Frage ist halt, ob wir technisch gesehen an ein Limit stoßen, verglichen mit dem wo wir vor ca. 30 Jahren gestartet sind, auch die Visionen etc., welche sich daraus ergeben. Oder ob da einfach durch zuviel Parasitentum und Verschachtelung von Produktionsmitteln auf wenige ein Stillstand herbeigeführt haben. Wir werden es sehen.
Dies alles saugt an der CPU aber eigentlich nicht an der GPU.
Im Echt, Nvidia hat großartige Arbeit geleistet. Samsung 8nm ist auf maximal 1,8GHz Takt optimiert, Nvidia schießt drüber beim ersten Versuch. Sie mitgieren den fehlenden Takt mit mehr L1-Cache und mehr FP32-ALUs. McRoll möchte ausgerechnet mehr Takt