Geforce RTX 3080/3090: Fehlt den Grafikkarten Leistung?

107
News George J. King Raffael Vötter Als bevorzugte Quelle auf Google hinzufügen
Haben die Nvidia-Grafikkarten ein Software-Problem?
Quelle: Nvidia

Wccftech wundert sich in einem längeren Test, dass die neuen Grafikkarten Geforce RTX 3080 und RTX 3090 zwar sehr schnell, aber nicht so schnell sind, wie es die technischen Daten und die Verdopplung der TFLOPS eigentlich erwarten lassen.

Laut Wccftech ist bei den neuen Grafikkarten von Nvidia rund um die Geforce RTX 3080 nicht alles so, wie es scheint. Man weist aber darauf hin, dass man sich seine eigene Meinung zu der Analyse bilden sollte. Da Nvidia die doppelte Grafikleistung im Vergleich mit der Turing-Generation versprochen hatte, müsste die Shader-Leistung ohne Besonderheiten wie DLSS oder Raytracing doppelt so hoch sein.

Tatsächlich ist die Geforce RTX 3090 aber nur 30 bis 50 Prozent schneller als eine Geforce RTX 2080 Ti, obwohl diese weniger als die Hälfte der Shader-Einheiten hat. Irgendwo geht laut Wccftech also Leistung verloren. Die Webseite sieht hier drei Möglichkeiten. So könnten die Ampere-Shader Turing unterlegen sein und die FP32-TFLOPS würden gar nicht erreicht. Oder es gibt irgendwo Probleme im BIOS, Microcode oder den Low-Level-Treibern für die Grafikkarte. Ein weiterer Punkt wäre eventuell, dass die High-Level-Treiber, Spiele-Engines oder Software-Stacks nicht in der Lage sind, die vielen Shader-Einheiten von Ampere zu nutzen. Ein Test mit VRAY zeigt, dass die FP32-Leistung tatsächlich doppelt so hoch ist wie bei einer Geforce RTX 2080 Ti. Damit kann die erste Möglichkeit gestrichen werden. In Tests mit 11 Spielen zeigt sich jedoch, dass die Geforce RTX 3090 im Durchschnitt nur 33 Prozent schneller ist.

Des Pudels Kern

Ein Extra-Artikel nur für diese Erkenntnis? Tatsächlich wollen wir den neuen Artikel von Wccftech nutzen, um eine womöglich untergegangene Information in unseren Launch-Tests etwas prominenter zu platzieren. Bei der "fehlenden" Leistung der Ampere-Grafikkarten handelt es sich mit an Sicherheit grenzender Wahrscheinlichkeit weder um ein Hardware- noch um ein Software-Problem - zumindest nicht im klassischen Sinne. Wie wir bereits in den Standard- und Bonustests zur Geforce RTX 3080 und RTX 3090 ausführen, liegt die schwache Skalierung mit der FP32-Leistung an zwei Dingen. Erstens wurden im GA102 (und späteren GA104) nicht alle Ausführungseinheiten verdoppelt, sondern nur die FP32-Einheiten. Ein 1:1-Vergleich mit Turing ist ohnehin nicht möglich, da dieser zwar nicht über doppelt vorhandene FP32-ALUs pro Shader-Multiprozessor verfügt, jedoch über INT32-Einheiten, welche die Leistung in Spielen erhöhen und somit die Rechnung verwässern.

Das zweite Problem ist die Software in Gestalt der Spiele. Wie frühere "Shader-Monster" auch - zu nennen sind unter anderem AMDs Hawaii- und Fiji-Chips - benötigen GPUs mit vielen Arithmetik-Einheiten einen ordentlichen Input, um ausgelastet zu werden. Es ist deutlich schwieriger, einen Chip mit 8.704 FP32-ALUs (RTX 3080) auszulasten, als einen mit nur 4.352 ALUs (RTX 2080 Ti). Der Chip-interne Scheduler erreicht dieses Kunststück (wie bei Fiji & Co.) nur bei sehr komplexen Shader-Programmen. Hinzu kommt, dass Spiele längst nicht nur aus Gleitkomma-Berechnungen bestehen, wenngleich diese zunehmen. Insgesamt spielt die Zeit in Amperes Hände, denn wir stehen vor einer neuen Spiele-Genration. Eine Möglichkeit, schon vorher die Auslastung zu erhöhen, sind hohe Auflösungen. Dann fallen pro Objekt auch mehr Shader-Operationen an und die ALUs laufen zu keiner Zeit leer. Die Geometrie-Einheiten drehen hingegen öfter Däumchen. Wenn Sie genauer wissen möchten, für was sich Ampere abseits von Rendering eignet und wie PCGH die Zukunftstauglichkeit der Architektur einschätzt, studieren Sie am besten die Technik-Abhandlung sowie die Extrem-Benchmarks.

107
    • Kommentare (107)

      Zur Diskussion im Forum
      • Von Olstyle Trockeneisprofi (m/w)
        Zitat von theGucky
        Denk daran Benchmarks werden unter bestimmten Bedingungen gemacht, meist mit sauberen OS und idealerweise ohne Hintergrundprogramme. Zu Hause müllt der PC zu und man hat z.b. auch mal einen zweiten Monitor mit Forefox/Chrome und ander Programme wie Discord etc.
        Dies alles saugt an der CPU aber eigentlich nicht an der GPU.
        Da schöne an der immernoch nicht idealen Mehrkernoptimierung ist aber dass das ab 6Kernen als reines SMT nebenher läuft ohne das Spiel zu tangieren.
        Allenfalls Videos schauen braucht ein bisschen Zusatzleistung. Aber die auch noch von der GPU.
      • Von Olstyle Trockeneisprofi (m/w)
        Zitat von theGucky
        Denk daran Benchmarks werden unter bestimmten Bedingungen gemacht, meist mit sauberen OS und idealerweise ohne Hintergrundprogramme. Zu Hause müllt der PC zu und man hat z.b. auch mal einen zweiten Monitor mit Forefox/Chrome und ander Programme wie Discord etc.
        Dies alles saugt an der CPU aber eigentlich nicht an der GPU.
        Da schöne an der immernoch nicht idealen Mehrkernoptimierung ist aber dass das ab 6Kernen als reines SMT nebenher läuft ohne das Spiel zu tangieren.
        Allenfalls Videos schauen braucht ein bisschen Zusatzleistung. Aber die auch noch von der GPU.
      • Von Basileukum Software-Overclocker(in)
        Naja, ist halt generell peinlich für unseren "westlichen" Fortschrittduktus.

        Alles wird schneller, kleiner, und verbraucht weniger, so geht Star Trek. Mittlerweile können wir teilweise nicht einmal bei Zurück in Zukunft mithalten.

        Die Frage ist halt, ob wir technisch gesehen an ein Limit stoßen, verglichen mit dem wo wir vor ca. 30 Jahren gestartet sind, auch die Visionen etc., welche sich daraus ergeben. Oder ob da einfach durch zuviel Parasitentum und Verschachtelung von Produktionsmitteln auf wenige ein Stillstand herbeigeführt haben. Wir werden es sehen.
      • Von theGucky Volt-Modder(in)
        Zitat von Olstyle
        Nur wenn Igor wieder zahme Settings auffährt. UHD und sogar WQHD mit richtig aufgedrehten Spielen(so wie bei Raffs Tests) ist schon heute nicht/kaum durch die CPU limitiert.
        Denk daran Benchmarks werden unter bestimmten Bedingungen gemacht, meist mit sauberen OS und idealerweise ohne Hintergrundprogramme. Zu Hause müllt der PC zu und man hat z.b. auch mal einen zweiten Monitor mit Forefox/Chrome und ander Programme wie Discord etc.
        Dies alles saugt an der CPU aber eigentlich nicht an der GPU.
      • Von -ElCritico-
        Zitat von deady1000
        Aha und dann mit 500W oder was?
        Sky is the limit!
        Im Echt, Nvidia hat großartige Arbeit geleistet. Samsung 8nm ist auf maximal 1,8GHz Takt optimiert, Nvidia schießt drüber beim ersten Versuch. Sie mitgieren den fehlenden Takt mit mehr L1-Cache und mehr FP32-ALUs. McRoll möchte ausgerechnet mehr Takt
      • Von deady1000 Volt-Modder(in)
        Zitat von McRoll
        Is doch easy. Überarbeiteter Platinenlayout mit anderer Kondensatorenbestückung, welche einen höheren Takt erlauben.
        Aha und dann mit 500W oder was?
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk