Direct Storage im Test: Fps-Benchmarks
Quelle: PC Games Hardware
Seite 2:

Direct Storage im Test: Fps-Benchmarks

16
Special Manuel Christa Raffael Vötter Als bevorzugte Quelle auf Google hinzufügen

Messwerte zu Direct Storage - Benchmarks sind das Elixir der PC-Enthusiasten und kommen hier zusammen mit einer Einschätzung.

PC Games Hardware setzt seit vielen Jahren auf eigene Benchmarkszenen auf Basis von Savegames - der jüngste Vorfall ist ein weiterer Grund, dabei zu bleiben. Neben den komfortablen Messungen der Ladezeiten mithilfe des spielinternen Benchmarks haben wir Forspoken selbstverständlich auch "richtig" gemessen. Dazu setzen wir auf eine anspruchsvolle Sequenz mit reichlich Vegetation, die zwar kein Worstcase-Szenario darstellt, jeder Grafikkarte aber überdurchschnittlich zusetzt.

Gaming-Benchmarks mit 4 Grafikkarten

Angetreten sind vier Grafikkarten: eine AMD Radeon RX 6800 XT, eine Nvidia Geforce RTX 3080, eine Intel Arc A770 und, als Bonusmodell, eine altehrwürdige Geforce GTX 1080 Ti. Um das ganze Leistungsbild zu zeichnen, testen wir zum einen in den drei populären Auflösungen Full HD, WQHD und Ultra HD. Außerdem prüfen wir die Leistung bei minimaler Auflösung: In 1.280 × 720 mit 33 Prozent interner Auflösung rückt der Fokus auf andere Flaschenhälse - wie den Durchsatz des Datenträgers respektive das Zusammenspiel mit dem Prozessor. Alle übrigen Details stehen auf dem Maximum, wobei nur die GTX 1080 Ti kein Raytracing darstellen kann. Dieses Modell und die Arc A770 übertakten wir leicht, um die Grundleistung anzuheben und damit ein wenig seltener grafiklimitiert zu sein. Was dabei herauskam, dokumentiert der folgende Benchmark.

Erwartungsgemäß verhalten sich die unterschiedlichen Grafikkarten respektive deren Treiber-Umsetzung von Direct Storage nicht identisch. Besonders deutlich reagiert die Geforce RTX 3080 als Vertreter aktueller Nvidia-Grafikkarten: Wird Direct Storage deaktiviert, bricht die Bildrate reproduzierbar ein. In jeder praktisch relevanten Auflösung erstickt der Unterschied im Grafiklimit.Wir messen einen maximalen Einbruch von 23 Prozent bei den Durchschnitts-Fps und sogar 31 Prozent beim P1-Perzentil. Diese Differenz tritt immer dann auf, wenn Direct Storage fehlt und ist unabhängig von der SSD-Schnittstelle - egal, ob SATA oder PCI-Express, der Unterschied ist markant. Es gibt jedoch eine wichtige Einschränkung, welche diese interessante Beobachtung praktisch irrelevant macht: Besagte Differenz tritt nur bei minimaler Grafiklast auf. In jeder praktisch relevanten Auflösung, also Full HD und darüber, erstickt der Unterschied im dominanten Grafiklimit.

Der Radeon RX 6800 XT ergeht es ähnlich wie der Geforce RTX 3080, interessanterweise aber mit einer Abweichung. Sehen wir uns auch hier zunächst die Ergebnisse bei minimaler Grafiklast an, erreichen drei von vier Einstellungen eine hohe Leistung, nur ein Setting fällt zurück: SATA ohne Direct Storage. Die bereits bei der Erwartung führenden Konfigurationen sind gleich schnell, nur die in jeder Hinsicht langsamste Einstellung ist nicht in der Lage, die Grafikkarte schnell genug mit Daten zu versorgen. Somit ist auch hier der Beweis erbracht, dass Direct Storage auch bei SATA eine helfende Rolle einnehmen kann. Fehlt das Feature, kann der Transfer das Geschehen ausbremsen. Ernüchterung folgt auf dem Fuße: Auch bei der Radeon RX 6800 XT führen praxisnahe Auflösungen dazu, dass die Unterschiede im Grafiklimit untergehen.

Sie ahnen sicher, wie es der Arc A770 ergeht. Diese Grafikkarte kann es in Sachen Leistung nicht mit den Vergleichsmodellen von AMD und Nvidia aufnehmen, ihre mittlere Gaming-Leistung liegt (mit aktivem Raytracing) auf dem Niveau einer Geforce RTX 3060 12GB bis Radeon RX 6750 XT. Daran ändert auch unsere Übertaktung auf 2,6 GHz (ausgehend von wackligen 2,4 GHz ab Werk) nichts, bereits die minimale Auflösung ist vollständig grafiklimitiert. Interessanterweise kann sich trotz vieler Durchläufe ausgerechnet die auf dem Papier langsamste Konfiguration minimal an die Spitze setzen. Wir verbuchen dies dennoch unter Messtoleranz, denn es gibt keine weiteren Anzeichen dafür, dass Direct Storage auf einer Arc-Grafikkarte Leistung kostet - zumindest nicht in Forspoken und zum jetzigen Zeitpunkt. Wie sich kommende Spiele verhalten, zeigt sich bei deren Erscheinen.

Die Geforce GTX 1080 Ti, in diesem Fall auf 2 GHz übertaktet, soll abschließend klären, ob "RTX IO" auch auf einer GTX-Grafikkarte funktioniert. RTX IO ist Nvidias Bezeichnung für Direct-Storage-Funktionalität im Treiber. Hier haben wir gute und schlechte Nachrichten: Sie kann es zweifellos, sodass die Ladezeiten im Spiel verkürzt werden, allerdings sind Fps-Unterschiede wegen der geringen Leistung ausgeschlossen. Wir konnten in keiner Auflösung Unterschiede provozieren, obwohl die GTX 1080 Ti als einziges Modell im Vergleich ohne Raytracing rendert. Am Ende des Tages ist das Ergebnis jedoch positiv, denn die grundsätzliche Befähigung alter Grafikkarten zu Direct Storage lässt darauf hoffen, dass diese noch ein paar Jahre ordentlich funktionieren.
Interessante Randbeobachtung: Der integrierte Benchmark bricht deutlich (!) ein, wenn Direct Storage (im Bild ist es eingeschaltet) per Kommando ... Quelle: PC Games Hardware Interessante Randbeobachtung: Der integrierte Benchmark bricht deutlich (!) ein, wenn Direct Storage (im Bild ist es eingeschaltet) per Kommando ...

Direct Storage: Zwischenfazit Februar 2023

Mit dieser ausgedehnten Messreihe haben wir das vollständige Bild von Direct Storage vor Augen - zumindest, soweit das derzeit möglich ist. Forspoken ist das erste und bislang einzige Spiel mit Direct Storage. Das Feature verspricht perspektivisch weit mehr, als die Ladezeiten um einige Sekunden zu verkürzen. Vielmehr soll das drastisch beschleunigte Streaming die Detailfülle signifikant anheben, wo heutige Verfahren im CPU-Limit verhungern würden. Halten wir bis dahin fest: Direct Storage kostet glücklicherweise keine Leistung (Fps), sondern bringt nur Vorteile in Gestalt kürzerer Ladezeiten. Fehlt das Feature, lassen sich in Forspoken Unterschiede messen, diese haben jedoch kaum Praxisrelevanz. Erst kommende Streaming-Schwergewichte - denkbar ist beispielsweise eine Umsetzung des Playstation-5-Spiels Ratchet & Clank: Rift Apart - werden das Potenzial der neuen Technologie ergründen.

16
  1. Seite 1 Direct Storage im Test: Überblick
  2. Seite 2 Direct Storage im Test: Fps-Benchmarks
    • Kommentare (16)

      Zur Diskussion im Forum
      • Von MightySH33p PC-Selbstbauer(in)
        Wenn die Technik voranschreitet würde es mich auch interessieren, ob der NVMe Slot Unterschiede macht, also ob man das Spiel auf der SSD hat die über die CPU Lanes oder die Chipsatz Lanes angebunden ist. Das kann jemand mit mehr Ahnung wohl schon theoretisch beantworten
      • Von MightySH33p PC-Selbstbauer(in)
        Wenn die Technik voranschreitet würde es mich auch interessieren, ob der NVMe Slot Unterschiede macht, also ob man das Spiel auf der SSD hat die über die CPU Lanes oder die Chipsatz Lanes angebunden ist. Das kann jemand mit mehr Ahnung wohl schon theoretisch beantworten
      • Von RyzA Flüssigstickstoff-Guru (m/w)
        Danke für den interessanten Artikel.

        Fazit: Direct Storage bringt scheinbar auch für Sata SSDs minimale Vorteile. Aber richtig lohnen tut es sich erst mit NVMe SSDs.
      • Von Supie12 Freizeitschrauber(in)
        Zitat von PCGH_Raff
        Ungleichmäßige Frame-Verteilung habe ich tatsächlich nur mit deaktiviertem Direct Storage beobachtet. Wo kommt das denn bei dir vor, nur im integrierten Benchmark?
        Hallo Raff,
        ich meinte in dem Vergleichsvideo das in dem Artikel drin ist, wenn man alle Szenen gleichtzeitig beobachtet, sieht man es im direkten Vergleich.
        Zitat von Homerclon
        Ich dachte, DirectStorage braucht NVMe, warum geht das nun auch mit einer SATA-SSD?
        Es ist eine Technik um Daten dierekt vom datenträger ins den V-Ram zu lesen, das hat erstmal nix mit dem verwendeten Datenträger zu tun, ginge vohl vil. sogar noch mit ner HD, der Unterschied ist, die Geschwindigkeit, das bringt halt bei ner HD nix. Ich meine das das irgendwo sogar im Vergleich mit getestet wurde.
        Hier ein VideoLeerzeichen nach dem ? entfernen).
        https://www.google.com/se... q=Direct+Storage+Test+%2Bhd&client=firefox-b-d&biw=1493&bih=767&ei=eULpY52uNraBxc8P4uWHiAI&ved=0ahUKEwjdzuGU4JD9AhW2QPEDHeLyASEQ4dUDCA4&uact=5&oq=Direct+Storage+Test+%2Bhd&gs_lcp=Cgxnd3Mtd2l6LXNlcnAQAzoKCAAQRxDWBBCwAzoHCAAQgAQQEzoLCAAQFhAeEPEEEBM6CQgAEBYQHhDxBEoECEEYAEoECEYYAFCMBVirD2DlEGgBcAF4AIABW4gBqQKSAQE0mAEAoAEByAEIwAEB&sclient=gws-wiz-serp#fpstate=ive&vld=cid:62d55469,vid:Ifux49qqGhc,st:137
      • Von Rockerfaeller04 Schraubenverwechsler(in)
        Zitat von Homerclon
        Ich dachte, DirectStorage braucht NVMe, warum geht das nun auch mit einer SATA-SSD?
        Das mit SATA hattet ihr auch noch im Artikel "Nie wieder Ladezeiten?" geschrieben.
        Die Auslagerung der Dekomprimierung von der CPU hin zur GPU spart Bandbreite und ist unabhängig vom genutzten Datenträger. Bei NVMe gibt es aber über das Operationssystem einen effizienteren Zugriff auf die Daten des Datenträgers. NVMe erlaubt mehr und längere Warteschlangen als bei SATA. Viele kleinere Zugriffe sind daher bei NVMe effizienter und führen zu einem wesentlich geringeren Einbruch der Übertragungsrate. Bei SATA sind viele kleine Dateizugriffe aber sehr ineffizient. Grafik-Assets werden bisher daher oft zusammen in großen Paket-Dateien gespeichert. Die Daten werden dann oft so gespeichert wie sie benötigt werden damit nicht zu viel unnötige Daten geladen werden, welche die GPU gar nicht braucht. Da das Dekomprimieren mit DirectStorage bei der GPU durchgeführt wird, werden nicht benötigten Daten dort sogar bis zur GPU geschickt, was Bandbreite kostet. Für DirectStorage ist es daher besser die einzelnen Grafik-Assets wieder getrennt auf den Datenträger zu speichern. Bei NVMe hat dies keine Nachteile und es bringt den Vorteil, dass wirklich nur die benötigten Daten an die GPU gesendet werden. Der Overhead kann daher deutlich reduziert werden.

        Vielleicht kann eines Tages die Grafikkarte die Daten sogar direkt von der NVMe holen ohne einen Umweg über die Pufferung im Arbeitsspeicher. Mittels eines direkten Datentransfer zweier PCIe Geräte (Vergleichbar mit PCIe peer-to-peer). Die I/O-Einheit des CPUs müsste da nur die Ausgangs-Lanes des einen mit dem Eingangs-Lanes des anderen Gerät verbinden und die Kerne selbst hätten dabei nichts zu tun anstatt wie jetzt Daten hin und her zu schieben und temporär im RAM abzulegen.
      • Von Rockerfaeller04 Schraubenverwechsler(in)
        Jedes moderne Betriebssystem nutzt soweit den freien Arbeitsspeicher als Lesecache für Datenträgerzugriffe. Darum startet ein Spiel in der Regel beim zweiten Laden um einiges schneller. Je mehr ungenutzten Arbeitsspeicher ein System also hat, desto mehr Daten können in diesem vorgehalten werden. Hier wäre daher die Frage ob es einen Systemneustart zwischen jeden einzelnen Testdurchlaufes gab, da andernfalls dieser Cache die Ergebnisse verfälschen würde.

        Da bei DirectStorage nicht mehr die CPU sonder die GPU das Decodieren der Grafik-Assets übernimmt erklärt es auch warum bei einer CPU limitierten Szene die FPS höher sind und warum in diesen Fall die Geschwindigkeit des Datenträgers weniger relevant ist. Jedoch nur solange auch noch neue Daten gestreamt werden. Wäre nur die Frage warum bei der Radeon RX 6800 XT die PCIe 4.0 SSD ohne DirectStorage nicht auch einbricht wie die SATA SSD. Um ein GPU-Limit vorzubeugen und so besser die Auswirkungen auf die CPU zu zeigen, wäre ein Test mit einer Nvidia 4090 sinnvoll. Schließlich geht es hierbei primär um die Technologie und um zu zeigen, wie ein entlasteter CPU dann eventuell mit einer besseren Grafikkarte gepaart werden könnte. Dies wäre auch besonders für zukünftige DirectStorage Spiele relevant, die nicht so start wie Forspoken GPU limitiert sind.

        Edit:

        Durch DirectStorage steigert sich der Datendurchsatz ja nur um die Komprimierungsrate der Assets. Der Datenträger hat daher immer noch einen viel größeren Einfluss. Ist auch gut zu sehen, da DirectStorage prozendual gesehen eine ähnliche Beschleunigung beim Laden bietet. Diese nimmt zwar mit zunehmender Ladezeit ab, aber das könnte durch steigenden Overhead erklärt werden. Ein Unterschied der Dekomprimierungsrate zwischen CPU und GPU ist aktuell wahrscheinlich eher vernachlässigbar.

        Edit 2:
        DirectStorage sollte bei der Bildwiederholrate nur helfen, wenn es ein CPU-Limit gibt. Sofern ein Spiel daher nicht alle Kerne ausreizen kann, sollte dieses Feature keine Verbesserung bringen. Je nach Spiel wäre es daher sogar möglich, dass sofern noch ungenutzte Kerne zur Verfügung stehen DirectStorage dann ebenfalls keine Verbesserung liefert. Die Anzahl der CPU Kerne könnte daher ebenfalls sehr entscheidend sein inwieweit DirectStorage einem Spiel bei den FPS hilft.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk