Direct Storage im Test: SATA gegen NVME, AMD gegen Nvidia gegen Intel, Ladezeiten und Fps

Kostet das neue Windows-Feature Direct Storage Leistung oder nicht? Nachdem unsere ersten Tests überraschende Ergebnisse hervorgebracht hatten, haben wir nun mit mehreren Laufwerken und Grafikkarten getestet, inwiefern sich Direct Storage auf die Ladezeiten und Performance auswirkt. Die Ergebnisse anhand des ersten Direct-Storage-Spiels Forspoken sind zweifellos interessant.

16
Special Manuel Christa Raffael Vötter Als bevorzugte Quelle auf Google hinzufügen
Direct Storage im Test: SATA gegen NVME, AMD gegen Nvidia gegen Intel, Ladezeiten und Fps
Quelle: PC Games Hardware

Direct Storage ist ein heißes Thema, da es ein weiterer technischer Evolutionsschritt ist, der für uns Spieler mehr aus der Hardware herausholt. Bei Direct Storage geht es hauptsächlich darum, die Geschwindigkeit des SSD-Speichers und der darauf basierenden Schnittstelle zu nutzen, um den CPU-Overhead zu reduzieren, der entsteht, wenn Spieldaten im Systemspeicher verschoben, dort dekomprimiert und erst dann in den Grafikkarten-Speicher kopiert werden. Direct Storage wurde entwickelt, um den Prozess der Entnahme der komprimierten Spieldaten von einem Laufwerk und das anschließende Rendern zu rationalisieren. Wer sich genauer für die Technologie dahinter interessiert, dem empfehlen wir unseren Artikel zum ersten synthetischen Benchmark für Direct Storage, in dem wir näher auf die Hintergründe eingehen. Hier soll es ausschließlich um die Spielpraxis gehen. Als Testvehikel dient uns das Action-Adventure Forspoken, welches am 24. Januar erschien. Das Spiel ist umstritten, hat aber zweifellos bildhübsche Momente - 20 Beweise dafür haben wir in der Bildergalerie geparkt:

Bildergalerie

Direct Storage kostet GPU-Leistung?

Nein, dieser mittlerweile weltbekannte Verdacht aus unserem Hands-on-Video zu Direct Storage in Forspoken hielt umfassenden Messungen nicht stand. Unsere ersten Benchmark-Stichproben haben nur scheinbar gezeigt, dass Direct Storage etwas GPU-Leistung abzwackt, was zunächst nicht unlogisch klingt, da die GPU zur Dekomprimierung genutzt werden sollte. Bei weiteren Messungen stellte sich dann heraus, dass dieses Ergebnis eine andere Ursache hatte: Wir protokollierten den gesamten integrierten Benchmark in Forspoken mithilfe unseres primären Mess-Tools CapFrameX. Dabei werden im integrierten Benchmark auch die schwarzen, mit hohen Bildraten dargestellten Ladebildschirme erfasst. Die Krux: Mit einer schnell ladenden NVME-SSD fallen diese Hoch-Fps-Phasen kürzer aus als mit einer relativ trägen SATA-SSD. So kam es zu dem viel diskutierten Ergebnis, dass Direct Storage anscheinend die Leistung senkt. Selbstverständlich war das mit einer Probe noch nicht in Stein gemeißelt, doch die Nachricht verbreitete sich wie ein Lauffeuer.

Viele Kolleginnen und Kollegen stellten daraufhin eigene Tests an und kamen ohne separates Fps-Logging zum Ergebnis, dass die These, Direct Storage koste GPU-Leistung, nicht haltbar ist. Schließlich brachte uns auch der Austausch mit unserer versierten Community im Forum auf unseren Fauxpas. Lange Rede, kurzer Sinn: Fehler passieren und nicht jede Annahme erweist sich als korrekt. Unter dem Strich hat die Sache aber etwas Gutes, denn Recherche ist ein Prozess, aus dem nicht nur wir, sondern auch andere Tester gelernt haben - nicht trotz, sondern wegen unserer schnellen Veröffentlichung. Zur journalistischen Sorgfalt gehört es aber auch, falsche Behauptungen als solche hinterher richtigzustellen, was wir mit einem Hinweis im Artikel und in der Videobeschreibung nachgetragen haben.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

SATA gegen PCI-E 3.0 gegen PCI-E 4.0

Grundlagenarbeit auf neuem Terrain geschieht nicht über Nacht. Und weil das so ist, haben wir in den letzten Tagen umfangreiche Nachtests angestellt, Patches für Forspoken abgewartet und sind nun in der Lage, ein genaues Bild zu zeichnen. Dafür haben wir zahlreiche Kombinationen aus SSDs, Grafikkarten und Einstellungen abgeklopft.

Für die Ladezeiten-Messungen der drei verschiedenen SSD-Schnittstellen haben wir den internen Benchmark von Forspoken verwendet. Da die händische Stoppuhr-Methode Ungenauigkeit bei den Nachkommastellen gebracht hätte, haben wir die Werte des internen Benchmarks ausgelesen. Da hier auch die Fps mit ausgegeben werden, haben wir auch diese notiert. Der interne Benchmark misst die Ladezeiten von insgesamt sieben Szenen und spuckt diese auch aufsummiert zusammen mit den durchschnittlichen Fps in einer Logdatei aus. Um nicht Nachkomma-Unterschiede analysieren zu müssen, haben wir die griffigere Summe aller Ladezeiten fürs Diagramm hergezogen. Wir testen nicht nur die Schnittstellen, sondern auch die Auswirkungen von Direct Storage mithilfe eines Startbefehls für Forspoken - damit lässt sich das Feature ein- und ausschalten.

Als Vertreter der drei SSD-Schnittstellen haben wir jeweils drei leistungsfähige Modelle verwendet. Bei der Corsair MP600 Pro XT (PCI-E 4.0) und der WD Black SN750 (PCI-E 3.0) handelt es sich jeweils um Topmodelle. Die SATA-SSD, eine Mushkin Striker, ist zwar schon etwas betagt, aber kaum ein SATA-Modell ist das nicht. Hier ist das Schnittstellen-Maximum der Leistung ohnehin schon lange erreicht, sodass selbst aktuellere Modelle hier keinen wesentlichen Unterschied gezeigt hätten.

Die Ladezeiten-Messungen hat zwar zwischenzeitlich das ganze Internet gemessen. Nun haben sich hier auch keine neuen Ergebnisse oder Erkenntnisse aufgetan, die unsere erste Analyse von vor einigen Wochen nicht schon gebracht hätten: Der Unterschied mit und ohne Direct Storage beläuft sich auf vernachlässigbare acht bis 15 Prozent Unterschied in den Ladezeiten. Zwischen NVME- und SATA-SSDs liegt aber noch ein deutlicher Faktor. Obwohl die Ladezeiten mit SATA circa dreimal so lange dauern, wird dadurch nicht das Spielerlebnis beeinträchtigt. Stets haben wir gepredigt, dass eine SATA-SSD zum Spielen vollkommen ausreicht, was an sich noch immer der Fall ist. Nur diese Messwerte mit Direct Storage zeigen, wohin die Reise geht: Zukünftige Titel, welche die Microsoft-Technologie intensiver nutzen werden, sollten besser auf einer NVME-SSD installiert sein. Um Sie hier zu beruhigen: Das kann noch gut etwas dauern, eine mit PCI Express 3.0 wird sicherlich auch ausreichen und preislich sind SSDs aktuell ziemlich günstig, sodass sich aktuell ohnehin keine SATA mehr wirklich lohnt.

Vorschau auf PCI Express 5.0

Der Youtube-Kanal "Compusemble" hat bereits das Phison-Referenzmodell parat und veröffentlicht erste Tests. Hier handelt es sich um den Controller Phison E26, der eine Leistung um die 10 GB/s liefert. Hier hat man die PCI-Express-5.0-SSD gegen 4.0 und 3.0 im Vergleich antreten lassen und die Ergebnisse sind fürs Erste recht unspektakulär:

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Die Adata XPG SX8200 Pro mit PCI Express Gen 3 liefert mit 13,8 Sekunden das langsamste Ergebnis. An zweiter Stelle steht die Samsung 990 Pro mit PCI Express Gen 4 - sie erreicht 10,9 Sekunden und ist damit merklich schneller. Der Sprung auf PCI Express 5 ist dann aber vernachlässigbar: Die Referenz-SSD mit dem Phison E26 lädt die Testszene in 10,5 Sekunden. Im genannten Messumfeld bringt der Sprung von PCI Express Gen 3 auf Gen 4 also noch einen Vorteil; der Sprung auf Gen 5 ist derweil vernachlässigbar. Der Sprung zwischen Gen 3 und Gen 4 ist zudem zwar merklich messbar und mit 32 Prozent auch deutlich, ob man nun aber in der Praxis einen Unterschied von knapp 3 Sekunden nennenswert nennen will, ist wohl am besten von jedem einzeln zu beantworten.

16
  1. Seite 1 Direct Storage im Test: Überblick
  2. Seite 2 Direct Storage im Test: Fps-Benchmarks
    • Kommentare (16)

      Zur Diskussion im Forum
      • Von MightySH33p PC-Selbstbauer(in)
        Wenn die Technik voranschreitet würde es mich auch interessieren, ob der NVMe Slot Unterschiede macht, also ob man das Spiel auf der SSD hat die über die CPU Lanes oder die Chipsatz Lanes angebunden ist. Das kann jemand mit mehr Ahnung wohl schon theoretisch beantworten
      • Von MightySH33p PC-Selbstbauer(in)
        Wenn die Technik voranschreitet würde es mich auch interessieren, ob der NVMe Slot Unterschiede macht, also ob man das Spiel auf der SSD hat die über die CPU Lanes oder die Chipsatz Lanes angebunden ist. Das kann jemand mit mehr Ahnung wohl schon theoretisch beantworten
      • Von RyzA Flüssigstickstoff-Guru (m/w)
        Danke für den interessanten Artikel.

        Fazit: Direct Storage bringt scheinbar auch für Sata SSDs minimale Vorteile. Aber richtig lohnen tut es sich erst mit NVMe SSDs.
      • Von Supie12 Freizeitschrauber(in)
        Zitat von PCGH_Raff
        Ungleichmäßige Frame-Verteilung habe ich tatsächlich nur mit deaktiviertem Direct Storage beobachtet. Wo kommt das denn bei dir vor, nur im integrierten Benchmark?
        Hallo Raff,
        ich meinte in dem Vergleichsvideo das in dem Artikel drin ist, wenn man alle Szenen gleichtzeitig beobachtet, sieht man es im direkten Vergleich.
        Zitat von Homerclon
        Ich dachte, DirectStorage braucht NVMe, warum geht das nun auch mit einer SATA-SSD?
        Es ist eine Technik um Daten dierekt vom datenträger ins den V-Ram zu lesen, das hat erstmal nix mit dem verwendeten Datenträger zu tun, ginge vohl vil. sogar noch mit ner HD, der Unterschied ist, die Geschwindigkeit, das bringt halt bei ner HD nix. Ich meine das das irgendwo sogar im Vergleich mit getestet wurde.
        Hier ein VideoLeerzeichen nach dem ? entfernen).
        https://www.google.com/se... q=Direct+Storage+Test+%2Bhd&client=firefox-b-d&biw=1493&bih=767&ei=eULpY52uNraBxc8P4uWHiAI&ved=0ahUKEwjdzuGU4JD9AhW2QPEDHeLyASEQ4dUDCA4&uact=5&oq=Direct+Storage+Test+%2Bhd&gs_lcp=Cgxnd3Mtd2l6LXNlcnAQAzoKCAAQRxDWBBCwAzoHCAAQgAQQEzoLCAAQFhAeEPEEEBM6CQgAEBYQHhDxBEoECEEYAEoECEYYAFCMBVirD2DlEGgBcAF4AIABW4gBqQKSAQE0mAEAoAEByAEIwAEB&sclient=gws-wiz-serp#fpstate=ive&vld=cid:62d55469,vid:Ifux49qqGhc,st:137
      • Von Rockerfaeller04 Schraubenverwechsler(in)
        Zitat von Homerclon
        Ich dachte, DirectStorage braucht NVMe, warum geht das nun auch mit einer SATA-SSD?
        Das mit SATA hattet ihr auch noch im Artikel "Nie wieder Ladezeiten?" geschrieben.
        Die Auslagerung der Dekomprimierung von der CPU hin zur GPU spart Bandbreite und ist unabhängig vom genutzten Datenträger. Bei NVMe gibt es aber über das Operationssystem einen effizienteren Zugriff auf die Daten des Datenträgers. NVMe erlaubt mehr und längere Warteschlangen als bei SATA. Viele kleinere Zugriffe sind daher bei NVMe effizienter und führen zu einem wesentlich geringeren Einbruch der Übertragungsrate. Bei SATA sind viele kleine Dateizugriffe aber sehr ineffizient. Grafik-Assets werden bisher daher oft zusammen in großen Paket-Dateien gespeichert. Die Daten werden dann oft so gespeichert wie sie benötigt werden damit nicht zu viel unnötige Daten geladen werden, welche die GPU gar nicht braucht. Da das Dekomprimieren mit DirectStorage bei der GPU durchgeführt wird, werden nicht benötigten Daten dort sogar bis zur GPU geschickt, was Bandbreite kostet. Für DirectStorage ist es daher besser die einzelnen Grafik-Assets wieder getrennt auf den Datenträger zu speichern. Bei NVMe hat dies keine Nachteile und es bringt den Vorteil, dass wirklich nur die benötigten Daten an die GPU gesendet werden. Der Overhead kann daher deutlich reduziert werden.

        Vielleicht kann eines Tages die Grafikkarte die Daten sogar direkt von der NVMe holen ohne einen Umweg über die Pufferung im Arbeitsspeicher. Mittels eines direkten Datentransfer zweier PCIe Geräte (Vergleichbar mit PCIe peer-to-peer). Die I/O-Einheit des CPUs müsste da nur die Ausgangs-Lanes des einen mit dem Eingangs-Lanes des anderen Gerät verbinden und die Kerne selbst hätten dabei nichts zu tun anstatt wie jetzt Daten hin und her zu schieben und temporär im RAM abzulegen.
      • Von Rockerfaeller04 Schraubenverwechsler(in)
        Jedes moderne Betriebssystem nutzt soweit den freien Arbeitsspeicher als Lesecache für Datenträgerzugriffe. Darum startet ein Spiel in der Regel beim zweiten Laden um einiges schneller. Je mehr ungenutzten Arbeitsspeicher ein System also hat, desto mehr Daten können in diesem vorgehalten werden. Hier wäre daher die Frage ob es einen Systemneustart zwischen jeden einzelnen Testdurchlaufes gab, da andernfalls dieser Cache die Ergebnisse verfälschen würde.

        Da bei DirectStorage nicht mehr die CPU sonder die GPU das Decodieren der Grafik-Assets übernimmt erklärt es auch warum bei einer CPU limitierten Szene die FPS höher sind und warum in diesen Fall die Geschwindigkeit des Datenträgers weniger relevant ist. Jedoch nur solange auch noch neue Daten gestreamt werden. Wäre nur die Frage warum bei der Radeon RX 6800 XT die PCIe 4.0 SSD ohne DirectStorage nicht auch einbricht wie die SATA SSD. Um ein GPU-Limit vorzubeugen und so besser die Auswirkungen auf die CPU zu zeigen, wäre ein Test mit einer Nvidia 4090 sinnvoll. Schließlich geht es hierbei primär um die Technologie und um zu zeigen, wie ein entlasteter CPU dann eventuell mit einer besseren Grafikkarte gepaart werden könnte. Dies wäre auch besonders für zukünftige DirectStorage Spiele relevant, die nicht so start wie Forspoken GPU limitiert sind.

        Edit:

        Durch DirectStorage steigert sich der Datendurchsatz ja nur um die Komprimierungsrate der Assets. Der Datenträger hat daher immer noch einen viel größeren Einfluss. Ist auch gut zu sehen, da DirectStorage prozendual gesehen eine ähnliche Beschleunigung beim Laden bietet. Diese nimmt zwar mit zunehmender Ladezeit ab, aber das könnte durch steigenden Overhead erklärt werden. Ein Unterschied der Dekomprimierungsrate zwischen CPU und GPU ist aktuell wahrscheinlich eher vernachlässigbar.

        Edit 2:
        DirectStorage sollte bei der Bildwiederholrate nur helfen, wenn es ein CPU-Limit gibt. Sofern ein Spiel daher nicht alle Kerne ausreizen kann, sollte dieses Feature keine Verbesserung bringen. Je nach Spiel wäre es daher sogar möglich, dass sofern noch ungenutzte Kerne zur Verfügung stehen DirectStorage dann ebenfalls keine Verbesserung liefert. Die Anzahl der CPU Kerne könnte daher ebenfalls sehr entscheidend sein inwieweit DirectStorage einem Spiel bei den FPS hilft.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 08/2026 PC Games 07/2026 play5 08/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk