Direct Storage im Test: Fps-Benchmarks
Messwerte zu Direct Storage - Benchmarks sind das Elixir der PC-Enthusiasten und kommen hier zusammen mit einer Einschätzung.
In diesem Artikel
PC Games Hardware setzt seit vielen Jahren auf eigene Benchmarkszenen auf Basis von Savegames - der jüngste Vorfall ist ein weiterer Grund, dabei zu bleiben. Neben den komfortablen Messungen der Ladezeiten mithilfe des spielinternen Benchmarks haben wir Forspoken selbstverständlich auch "richtig" gemessen. Dazu setzen wir auf eine anspruchsvolle Sequenz mit reichlich Vegetation, die zwar kein Worstcase-Szenario darstellt, jeder Grafikkarte aber überdurchschnittlich zusetzt.
Gaming-Benchmarks mit 4 Grafikkarten
Angetreten sind vier Grafikkarten: eine AMD Radeon RX 6800 XT, eine Nvidia Geforce RTX 3080, eine Intel Arc A770 und, als Bonusmodell, eine altehrwürdige Geforce GTX 1080 Ti. Um das ganze Leistungsbild zu zeichnen, testen wir zum einen in den drei populären Auflösungen Full HD, WQHD und Ultra HD. Außerdem prüfen wir die Leistung bei minimaler Auflösung: In 1.280 × 720 mit 33 Prozent interner Auflösung rückt der Fokus auf andere Flaschenhälse - wie den Durchsatz des Datenträgers respektive das Zusammenspiel mit dem Prozessor. Alle übrigen Details stehen auf dem Maximum, wobei nur die GTX 1080 Ti kein Raytracing darstellen kann. Dieses Modell und die Arc A770 übertakten wir leicht, um die Grundleistung anzuheben und damit ein wenig seltener grafiklimitiert zu sein. Was dabei herauskam, dokumentiert der folgende Benchmark.
Erwartungsgemäß verhalten sich die unterschiedlichen Grafikkarten respektive deren Treiber-Umsetzung von Direct Storage nicht identisch. Besonders deutlich reagiert die Geforce RTX 3080 als Vertreter aktueller Nvidia-Grafikkarten: Wird Direct Storage deaktiviert, bricht die Bildrate reproduzierbar ein. In jeder praktisch relevanten Auflösung erstickt der Unterschied im Grafiklimit.
Wir messen einen maximalen Einbruch von 23 Prozent bei den Durchschnitts-Fps und sogar 31 Prozent beim P1-Perzentil. Diese Differenz tritt immer dann auf, wenn Direct Storage fehlt und ist unabhängig von der SSD-Schnittstelle - egal, ob SATA oder PCI-Express, der Unterschied ist markant. Es gibt jedoch eine wichtige Einschränkung, welche diese interessante Beobachtung praktisch irrelevant macht: Besagte Differenz tritt nur bei minimaler Grafiklast auf. In jeder praktisch relevanten Auflösung, also Full HD und darüber, erstickt der Unterschied im dominanten Grafiklimit.
Der Radeon RX 6800 XT ergeht es ähnlich wie der Geforce RTX 3080, interessanterweise aber mit einer Abweichung. Sehen wir uns auch hier zunächst die Ergebnisse bei minimaler Grafiklast an, erreichen drei von vier Einstellungen eine hohe Leistung, nur ein Setting fällt zurück: SATA ohne Direct Storage. Die bereits bei der Erwartung führenden Konfigurationen sind gleich schnell, nur die in jeder Hinsicht langsamste Einstellung ist nicht in der Lage, die Grafikkarte schnell genug mit Daten zu versorgen. Somit ist auch hier der Beweis erbracht, dass Direct Storage auch bei SATA eine helfende Rolle einnehmen kann. Fehlt das Feature, kann der Transfer das Geschehen ausbremsen. Ernüchterung folgt auf dem Fuße: Auch bei der Radeon RX 6800 XT führen praxisnahe Auflösungen dazu, dass die Unterschiede im Grafiklimit untergehen.
Sie ahnen sicher, wie es der Arc A770 ergeht. Diese Grafikkarte kann es in Sachen Leistung nicht mit den Vergleichsmodellen von AMD und Nvidia aufnehmen, ihre mittlere Gaming-Leistung liegt (mit aktivem Raytracing) auf dem Niveau einer Geforce RTX 3060 12GB bis Radeon RX 6750 XT. Daran ändert auch unsere Übertaktung auf 2,6 GHz (ausgehend von wackligen 2,4 GHz ab Werk) nichts, bereits die minimale Auflösung ist vollständig grafiklimitiert. Interessanterweise kann sich trotz vieler Durchläufe ausgerechnet die auf dem Papier langsamste Konfiguration minimal an die Spitze setzen. Wir verbuchen dies dennoch unter Messtoleranz, denn es gibt keine weiteren Anzeichen dafür, dass Direct Storage auf einer Arc-Grafikkarte Leistung kostet - zumindest nicht in Forspoken und zum jetzigen Zeitpunkt. Wie sich kommende Spiele verhalten, zeigt sich bei deren Erscheinen.
Die Geforce GTX 1080 Ti, in diesem Fall auf 2 GHz übertaktet, soll abschließend klären, ob "RTX IO" auch auf einer GTX-Grafikkarte funktioniert. RTX IO ist Nvidias Bezeichnung für Direct-Storage-Funktionalität im Treiber. Hier haben wir gute und schlechte Nachrichten: Sie kann es zweifellos, sodass die Ladezeiten im Spiel verkürzt werden, allerdings sind Fps-Unterschiede wegen der geringen Leistung ausgeschlossen. Wir konnten in keiner Auflösung Unterschiede provozieren, obwohl die GTX 1080 Ti als einziges Modell im Vergleich ohne Raytracing rendert. Am Ende des Tages ist das Ergebnis jedoch positiv, denn die grundsätzliche Befähigung alter Grafikkarten zu Direct Storage lässt darauf hoffen, dass diese noch ein paar Jahre ordentlich funktionieren.
Quelle: PC Games Hardware
Interessante Randbeobachtung: Der integrierte Benchmark bricht deutlich (!) ein, wenn Direct Storage (im Bild ist es eingeschaltet) per Kommando ...
Direct Storage: Zwischenfazit Februar 2023
Mit dieser ausgedehnten Messreihe haben wir das vollständige Bild von Direct Storage vor Augen - zumindest, soweit das derzeit möglich ist. Forspoken ist das erste und bislang einzige Spiel mit Direct Storage. Das Feature verspricht perspektivisch weit mehr, als die Ladezeiten um einige Sekunden zu verkürzen. Vielmehr soll das drastisch beschleunigte Streaming die Detailfülle signifikant anheben, wo heutige Verfahren im CPU-Limit verhungern würden. Halten wir bis dahin fest: Direct Storage kostet glücklicherweise keine Leistung (Fps), sondern bringt nur Vorteile in Gestalt kürzerer Ladezeiten. Fehlt das Feature, lassen sich in Forspoken Unterschiede messen, diese haben jedoch kaum Praxisrelevanz. Erst kommende Streaming-Schwergewichte - denkbar ist beispielsweise eine Umsetzung des Playstation-5-Spiels Ratchet & Clank: Rift Apart - werden das Potenzial der neuen Technologie ergründen.

Fazit: Direct Storage bringt scheinbar auch für Sata SSDs minimale Vorteile. Aber richtig lohnen tut es sich erst mit NVMe SSDs.
ich meinte in dem Vergleichsvideo das in dem Artikel drin ist, wenn man alle Szenen gleichtzeitig beobachtet, sieht man es im direkten Vergleich.
Hier ein Video
https://www.google.com/se... q=Direct+Storage+Test+%2Bhd&client=firefox-b-d&biw=1493&bih=767&ei=eULpY52uNraBxc8P4uWHiAI&ved=0ahUKEwjdzuGU4JD9AhW2QPEDHeLyASEQ4dUDCA4&uact=5&oq=Direct+Storage+Test+%2Bhd&gs_lcp=Cgxnd3Mtd2l6LXNlcnAQAzoKCAAQRxDWBBCwAzoHCAAQgAQQEzoLCAAQFhAeEPEEEBM6CQgAEBYQHhDxBEoECEEYAEoECEYYAFCMBVirD2DlEGgBcAF4AIABW4gBqQKSAQE0mAEAoAEByAEIwAEB&sclient=gws-wiz-serp#fpstate=ive&vld=cid:62d55469,vid:Ifux49qqGhc,st:137
Das mit SATA hattet ihr auch noch im Artikel "Nie wieder Ladezeiten?" geschrieben.
Vielleicht kann eines Tages die Grafikkarte die Daten sogar direkt von der NVMe holen ohne einen Umweg über die Pufferung im Arbeitsspeicher. Mittels eines direkten Datentransfer zweier PCIe Geräte (Vergleichbar mit PCIe peer-to-peer). Die I/O-Einheit des CPUs müsste da nur die Ausgangs-Lanes des einen mit dem Eingangs-Lanes des anderen Gerät verbinden und die Kerne selbst hätten dabei nichts zu tun anstatt wie jetzt Daten hin und her zu schieben und temporär im RAM abzulegen.
Da bei DirectStorage nicht mehr die CPU sonder die GPU das Decodieren der Grafik-Assets übernimmt erklärt es auch warum bei einer CPU limitierten Szene die FPS höher sind und warum in diesen Fall die Geschwindigkeit des Datenträgers weniger relevant ist. Jedoch nur solange auch noch neue Daten gestreamt werden. Wäre nur die Frage warum bei der Radeon RX 6800 XT die PCIe 4.0 SSD ohne DirectStorage nicht auch einbricht wie die SATA SSD. Um ein GPU-Limit vorzubeugen und so besser die Auswirkungen auf die CPU zu zeigen, wäre ein Test mit einer Nvidia 4090 sinnvoll. Schließlich geht es hierbei primär um die Technologie und um zu zeigen, wie ein entlasteter CPU dann eventuell mit einer besseren Grafikkarte gepaart werden könnte. Dies wäre auch besonders für zukünftige DirectStorage Spiele relevant, die nicht so start wie Forspoken GPU limitiert sind.
Edit:
Durch DirectStorage steigert sich der Datendurchsatz ja nur um die Komprimierungsrate der Assets. Der Datenträger hat daher immer noch einen viel größeren Einfluss. Ist auch gut zu sehen, da DirectStorage prozendual gesehen eine ähnliche Beschleunigung beim Laden bietet. Diese nimmt zwar mit zunehmender Ladezeit ab, aber das könnte durch steigenden Overhead erklärt werden. Ein Unterschied der Dekomprimierungsrate zwischen CPU und GPU ist aktuell wahrscheinlich eher vernachlässigbar.
Edit 2:
DirectStorage sollte bei der Bildwiederholrate nur helfen, wenn es ein CPU-Limit gibt. Sofern ein Spiel daher nicht alle Kerne ausreizen kann, sollte dieses Feature keine Verbesserung bringen. Je nach Spiel wäre es daher sogar möglich, dass sofern noch ungenutzte Kerne zur Verfügung stehen DirectStorage dann ebenfalls keine Verbesserung liefert. Die Anzahl der CPU Kerne könnte daher ebenfalls sehr entscheidend sein inwieweit DirectStorage einem Spiel bei den FPS hilft.