Raytracing-Showcase getestet: Ampere deklassiert Turing und RDNA 2 - ein Blick in die Zukunft?
Mit dem ART-Mark erschien just ein sehenswerter Raytracing-Benchmark auf Basis der Unreal Engine 4. Der Macher hat es sich zum Ziel gesetzt, aktuelle Raytracing-Grafikkarten wie die Geforce RTX 3090 und Radeon RX 6900 XT niederzustrecken - nicht auf stupide Art und Weise, sondern durch exzessiven Einsatz von Spiegelungen. PCGH hat Testrunden mit dem ART-Mark gedreht und dabei Erstaunliches beobachtet.
Vermutlich haben Sie wegen der Überschrift auf diesen Artikel geklickt. Was zunächst reißerisch klingt, entspricht in diesem konkreten Fall jedoch der Wahrheit - und liefert somit wertvolle Informationen für alle, die Grafikkarten nicht als Teil einer Religion sehen, sondern als High-Tech-Geräte, die teilweise viele Jahre verwendet werden sollen. Dabei ist nicht nur die Leistung in der Gegenwart von Interesse, sondern auch die in der Zukunft. Da niemand das Zeitreisen beherrscht, müssen andere Mittel her. In unserem Fall leistet das vorausschauende, teils wahnsinnige Software - Leser unserer berüchtigten Speichertests wissen, dass die PCGH hier gerne Ausblicke wagt.
Speicher ist diesmal nicht das Thema, sondern Raytracing. Tatsächlich hat das eine große Auswirkungen auf das andere, in diesem Artikel soll es jedoch um die pure Raytracing-Leistung aktueller Grafikchips gehen. Diese lässt sich entweder als kryptische TFLOPS-Zahl ausgeben, oder in Form von Fps. Letzteres ist deutlich praxisnäher, symbolisiert sie doch eine Bewegung am Bildschirm. Mit dem ART-Mark, kurz für "Another Ray-Tracing Benchmark" erschien just ein Programm, das die Raytracing-Leistung aktueller GPUs nicht bloß auf eine sehr harte Probe stellt, sondern auch ganz neue Verhältnisse offenbart. Wir haben den ART-Mark im Rahmen unserer dauerhaften Raytracing-Recherche ausprobiert, welche in Kürze im Raytracing-Leistungsindex 2021 mündet.
ART-Mark: Raytracing in Reinkultur
Der ART-Mark ist das 1-Mann-Projekt eines technikaffinen Hobby-Entwicklers auf Basis der weitverbreiteten Unreal Engine 4 (UE4). Der Schöpfer "Perschistence" alias Geldmann3 erläutert in der Vorstellung des Projekts seine Zielsetzung: Die Leistung aktueller Raytracing-GPUs soll bestmöglich abgebildet werden. Zu diesem Zweck erschuf er in tagelanger Arbeit ein UE4-Projekt, das exzessiven Gebrauch von Raytracing macht, um jede dazu fähige GPU maximal zu fordern. Der ART-Mark ist in seiner aktuellen Version sehr komfortabel nutz- und konfigurierbar: Neben verschiedenen Raytracing-Komplexitäten steht auch ein Rasterizing-Fallback bereit. Letzterer imitiert die mittels Raytracing darstellbaren Effekte durch Planar Reflections, also das mehrfache Berechnen der Szene, in Kombination mit Screen-Space-Reflections. Das Ergebnis sieht interessant aus, offenbart aber klar, warum Raytracing die Lösung vieler Probleme ist: Die alten Techniken sind nicht in der Lage, akkurate Spiegelungen abzubilden - und erst recht keine Spiegelungen in Spiegelungen (in Spiegelungen ...). Der folgende Vergleich zeigt diese Tatsache auf beeindruckende Weise und ist damit ein Showcase für die Möglichkeiten von und mit Raytracing:
Das technische Know-How eignete sich Perschistence selbst an. Die Basis bildet die seit einigen Monaten ab Werk Raytracing-fähige Engine von Epic, welche bereits in zahlreichen Projekten Raytracing-Support bietet, darunter Fortnite, The Medium, Bright Memory, Ghostrunner und Pumpkin Jack. ART-Mark nutzt den nativen, generischen DirectX-Raytracing-Code der Engine, welcher in den Grundzügen für Nvidias Turing-Architektur erstellt und im Laufe der Zeit verfeinert wurde. Mittlerweile läuft das DXRaytracing auf Ampere (RTX 30), Turing (RTX 20) und RDNA 2 (RX 6000). Händische Optimierungen sind nicht enthalten.
Bisherige UE4-Spiele mit DXR zeigten eine gewisse Geforce-Affinität. Inwiefern diese auf den Code oder die RT-Implementierung innerhalb der Grafikchips zurückzuführen ist, kann nicht abschließend geklärt werden. Fakt ist jedoch, dass viele Spiele auf Basis der Unreal Engine 4 selektives Raytracing (meist für Reflexionen) erlauben und die Performance damit nun mal so ist, wie sie ist.
Ebenfalls nativ in der UE4 zu finden ist mittlerweile Nvidias Upsampling-Feature DLSS 2.0. Wie üblich wird dabei intern mit spatial reduzierter Auflösung gerechnet und der Verlust durch clevere temporale Verrechnung über mehrere aufeinander folgende Frames kompensiert. DLSS lässt sich im ART-Mark in allen vier verfügbaren Modi (Quality, Balanced, Performance, Ultra Performance) zuschalten und mit dem TAAU (Temporal AA Upsampling) der UE4 vergleichen. Optisch weiß DLSS beim dargestellten Inhalt nicht unbedingt zu gefallen, allerdings wird die Kern-Idee von DLSS optimal aufgegriffen: die von Raytracing geplagte GPU zu entlasten.
Leistungstest: RDNA 2 vs. Turing vs. Ampere
Qualität kommt bekanntlich von Qualen - und diese erleiden alle Raytracing-Chips im ART-Mark. Der Benchmark legt seinen Fokus auf die pure Raytracing-Leistung rund um die Erstellung einer Bounding Volume Hierarchy (BVH) und anschließendes Shading. Das bildfüllende Casten und Tracen (Absenden und Verfolgen) von virtuellen Lichtstrahlen mit zahlreichen Bounces (Abprallern) sorgt für die dynamische Pracht des Tests, hat mit einem "normalen" Gaming-Alltag jedoch nichts zu tun. Rasterizing-Performance spielt nur eine Nebenrolle.
Interessanterweise geschieht all dies selbst bei hohen Qualitätsstufen mit nur einem Strahl pro Pixel, was den Denoiser der Unreal Engine 4 auf eine harte Probe stellt. Erst das Preset "Absolute Overkill", PCGH-intern "Diashow" genannt, verschießt zwei Strahlen pro Pixel - und lässt wahnwitzige 50 Bounces nachverfolgen. Die darunter angesiedelten Presets sind wegen der drastisch reduzierten Bounces freundlicher zu den Grafikchips, aber dennoch äußerst anspruchsvoll (siehe Bilder der Settings unten). Bemerkenswert ist, dass Perschistence mit "RT High" ein Szenario geschaffen hat, dessen Leistungskosten mit dem aufwendigen Raster-Imitat vergleichbar sind, das optisch aber haushoch überlegen ist. RT High kommt einer praxisnahen Implementierung in ein Next-Gen-Spiel somit am nächsten und verdient im folgenden Benchmark daher besondere Aufmerksamkeit (und ist daher standardmäßig eingeblendet).
Zum Test angetreten ist alles, was in Sachen Raytracing Rang und Namen hat: RDNA 2, Turing und Ampere in verschiedenen Ausbaustufen. Die Selektion der Karten zeigt nicht nur, was die jeweiligen Topmodelle leisten, sondern auch, wie gut Derivate mit der halben GPU-/Raytracing-Leistung abschneiden. Blendet man den Takt und das Speichersubsystem aus, entspricht die Geforce RTX 2060 Super einer halben RTX 2080 Ti (34 zu 68 SMs = RT-Cores) und die Radeon RX 6700 XT einer halben RX 6900 XT (40 zu 80 CUs = Ray Accelerators).
Wir testen jeweils Referenzkarten mit den zum Testzeitpunkt aktuellen Treibern. rBAR und SAM sind bei unseren Benchmarks seit April standardmäßig aktiv, aber in diesem Test vermutlich unwirksam. Alle Tests finden in Full HD statt, welches die Teilnehmer bereits maximal fordert - die Standardeinstellung des ART-Mark ist 720p. Die Ergebnisse könnten spannender kaum sein:
ART-Mark - Another Ray-Tracing Benchmark
ART-Mark im Test mit Ampere, RDNA 2 und Turing
|
|
|
-
Resolution/AA (1 von 4)
-
0 von 6 Produkten sichtbar
Beachten Sie bitte, dass Sie neben "RT High" auch drei andere Qualitätsstufen einblenden können. Das Raytracing-freie Preset "No RT Extreme" dient nur zu Vergleichszwecken mit dem Raytracing-Leistungsverlust.
Außergewöhnlich ist die Performance von Nvidias aktueller Ampere-Architektur: Die Geforce RTX 3090 kann sich um stattliche 119 bis 171 Prozent von der RTX 2080 Ti absetzen. Einen derartigen Abstand zwischen den Top-Chips der Architekturen gibt es in dieser Ausprägung sonst nirgends, weder bei den Pathtracing-Portierungen Minecraft RTX und Quake 2 RTX, noch bei Raytracing-Vorzeigespielen Cyberpunk 2077
Die RTX 3090 kann sich um stattliche 119 bis 171 Prozent von der RTX 2080 Ti absetzen.
und Control. Die Ampere-Stärke führt auch zum unbekannten Bild, dass die RTX 3060 Ti um 19 bis 61 Prozent vor der RTX 2080 Ti rangiert. Ungeachtet dessen, dass beide Modelle hoffnungslos mit RT Ultra oder Overkill überfordert sind, zeigen sich hier klar die Verbesserungen innerhalb der Ampere-GPUs. Was genau die signifikante Leistungssteigerung bringt, ist von außen nicht ersichtlich. Fakt ist, dass Ampere über verbesserte RT-Kerne verfügt und das anstehende Shading theoretisch mit einer verdoppelten FP32-Leistung umsetzen kann. Offenbar schlägt in diesem Szenario die Sternstunde der Ampere-Architektur. Zur Erinnerung: Die Triangle Intersection Rate (das Aufspüren von Polygonen im Raum) der RT-Cores 2.0 wurde laut Nvidia gegenüber Turing verdoppelt.
Die Befürchtung, dass AMDs RDNA-2-Architektur angesichts dieser Zahlen unter die Räder gerät, bewahrheitet sich nur zum Teil. Was Raytracing angeht, entspricht RDNA 2 der Turing-Generation, beide Architekturen zeigen die erste Raytracing-Implementierung ins Silizium. Die Herangehensweise unterscheidet sich jedoch und Nvidia ist mit Ampere bereits bei der zweiten Iteration angekommen. Die Radeon-Macher geben an, dass die Raytracing-Leistung vom Infinity Cache profitiert und dass es sich beim Raytracing um reine Compute Shader Launches handelt, was Aufschluss über einen wichtigen Unterschied gibt: Während Nvidias RT-Cores auch die BVH-Struktur erstellen und beschleunigen, wird diese Aufgabe bei AMD von den Shader-ALUs erledigt. Immerhin: Shading, Texture Fetching und BVH Traversal (die mit Abstand teuerste Komponente) laufen in Navi 2x stets parallel.
Vergleicht man die ersten Raytracing-Architekturen von AMD und Nvidia miteinander (ungeachtet des zeitlichen Abstands), kann RDNA 2 den Anschluss halten. Die Geforce RTX 2080 Ti ist um bestenfalls vier Prozent schneller (RT High), die komplexeren Modi gewinnt die Radeon RX 6900 XT mit 23 bis 32 Prozent Abstand. Akzeptable Bildraten erreichen beide Grafikkarten nur bei RT High. Da Letzteres einen optisch sehr ansehnlichen Kompromiss aus Pracht und Leistungshunger darstellt, ist eine gewisse Relevanz nicht von der Hand zu weisen. Künftige Spiele mit breitflächigem Raytracing-Einsatz werden stets Rücksicht auf die erste RT(X)-Generation nehmen. Wir rechnen erst in der zweiten Hälfte dieses Jahrzehnts mit derart komplexen Berechnungen, dass Turing und RDNA 2 völlig den Anschluss verlieren. Ein solches Szenario skizziert der ART-Mark, Ampere ist allein auf weiter Flur. Kleinere 1st-Gen-Modelle wie die Radeon RX 6700 XT und Geforce RTX 2060(S) sind dann selbst mit massiven Upscaling-Faktoren bedroht.
DLSS Quality steigert Leistung um Faktor 2
Je höher die Strahlenbelastung, desto effektiver kann Upscaling bzw. Upsampling entlasten. Wir haben testweise den hochwertigsten DLSS-Modus Quality (Qualität) auf den teilnehmenden Geforce-RTX-Grafikkarten laufen lassen und im zweiten Benchmark-Set abgebildet. Die Ergebnisse entsprechen hier den Erwartungen, im Mittel kann DLSS die Bildrate um den Faktor 2 erhöhen, meist sogar etwas mehr. Doch auch hier ist ein interessantes Detail versteckt: Ampere profitiert nicht stärker von DLSS als Turing, sondern in etwa genauso viel. Wer unsere Technikabhandlung zu Ampere genau durchgelesen hat, erwartet möglicherweise etwas anderes, denn Ampere ist in der Lage, alle modernen Kalkulationen parallel auszuführen ("Concurrent Execution"). Turing kann nicht gleichzeitig FP32-, RT- und Tensor-Berechnungen ausführen, sondern immer nur zwei von dreien. Diese Fertigkeit muss gezielt vom Renderer angesprochen werden und fehlt möglicherweise bei der aktuellen Unreal Engine 4. Angesichts der engen Zusammenarbeit mit Nvidia ist das jedoch verwunderlich. Falls Sie, werte Leser, Details zu diesen Engine-Interna kennen, lassen Sie es uns gerne in den Kommentaren wissen.
Fazit und Ausblick
Der ART-Mark zeigt ein weiteres Mal auf, wie rechenaufwendig Vollbild-Raytracing ist. Dabei fallen vor allem die sogenannten Secondary Rays ins Gewicht, also jene, die nach dem ersten Aufprallen verfolgt werden - je mehr Bounces, desto geringer die Leistung. Während diese Tatsache allgemein bekannt ist, offenbart der Benchmark auch Dinge, die bisher nur erahnt werden konnten. Da wäre der Generationssprung bei Nvidia: Im Herbst 2018 erschien mit Turing die erste RT(X)-Generation als Geforce RTX 20. Zwei Jahre später erblickte Ampere alias Geforce RTX 30 das Licht der Welt, Nvidias nunmehr zweite RT(X)-Generation. Vollmundig bewarben die Kalifornier ihre Errungenschaften auf dem Gebiet der Strahlverfolgung, doch in der Praxis bleib vom versprochenen Faktor 2 wenig übrig. DLSS musste es richten, seit Version 2.0 durchaus erfolgreich und ansehnlich.
Mit jeder neuen Raytracing-Anwendung wird das Versprechen rund um die RT-Kerne 2.0 und die Tensor-Kerne 3.0 erneut auf die Probe gestellt. Der ART-Mark zeigt, was Control, Minecraft RTX & Co. nur unscharf skizzieren konnten, nämlich wohin die Reise künftig gehen könnte: Je komplexer die Strahlverfolgung im Raum, desto besser performt Ampere. Das Ausmaß der Differenz hängt von der Implementierung ab, wobei der ART-Mark mithilfe der Unreal Engine 4 ans Äußerste geht. Der bei hohen Einstellungen übertriebene Einsatz von Strahlen zur Darstellung von Reflexionen in Reflexionen, welche eine Vielzahl von Bounces - reflektiertem Licht - verursachen, zeigt das grafische Potenzial der Technologie. Vergleicht man Turing-TU102 als 1st-Gen-RTX mit Ampere-GA102, ist Ampere um bis zu Faktor 2,7 schneller. Zieht man nur (halbwegs) flüssig dargestellte Einstellungen heran, in diesem Fall "RT High", ist es immer noch der Faktor 2,2 und somit deutlich mehr als in allen derzeitigen Raytracing-Spielen. Das liegt gewiss an der Szene, welche rein auf Raytracing-Last ausgelegt ist und entsprechend besser aussieht als althergebrachte Rasterisierung.
Vergleicht man nun Nvidias erste RT-Generation mit AMDs erster RT-Generation, ergibt sich ein Gleichstand. Tatsächlich stecken die RDNA-2-GPUs, besser bekannt als Radeon RX 6000, komplexere Raytracing-Kalkulationen besser weg als Turing. Das Preset RT High des ART-Mark läuft auf einer Radeon RX 6900 XT indes genauso gut wie auf einer Geforce RTX 2080 Ti. Gegen eine RTX 3060 Ti und aufwärts ist bei rohem Raytracing unterdessen kein Radeon-Kraut gewachsen. AMD wird diesen Rückstand mit RDNA 3 angehen, das ist gewiss.
Was lernen wir aus den jüngsten Beobachtungen? Es gibt gute Gründe dafür, dass Raytracing wohldosiert und nicht mit der Gießkanne angewendet wird. Die GPU-Schmieden sind sich ihrer Stärken bewusst, sodass Nvidia in der Regel Spiele sponsert, die in Sachen Raytracing klotzen - beispielsweise Cyberpunk 2077. AMD lässt es langsamer angehen, Dirt 5 und Godfall nutzen Raytracing nur für Schatten. Mit Resident Evil 8: Village und Metro Exodus Enhanced Edition stehen Anfang Mai gleich zwei neue Bewährungsproben an, welche voraussichtlich unterschiedliche Ansprüche haben. Die Marschrichtung hin zu Raytracing ist somit klar, nur die Geschwindigkeit und Intensität schwankt. Mit der angekündigten Unreal Engine 5 stehen weitere Änderungen und Optimierungen ins Haus, welche möglicherweise eine Verschiebung der Verhältnisse bringen. Es bleibt in jedem Fall spannend, denn in Sachen Raytracing stehen wir trotz klarer Fortschritte erst am Anfang. PCGH bleibt selbstverständlich für Sie am Ball und hofft, dass Ihnen dieser Einblick gefallen hat.
