Direct Storage im Test: SATA gegen NVME, AMD gegen Nvidia gegen Intel, Ladezeiten und Fps
Kostet das neue Windows-Feature Direct Storage Leistung oder nicht? Nachdem unsere ersten Tests überraschende Ergebnisse hervorgebracht hatten, haben wir nun mit mehreren Laufwerken und Grafikkarten getestet, inwiefern sich Direct Storage auf die Ladezeiten und Performance auswirkt. Die Ergebnisse anhand des ersten Direct-Storage-Spiels Forspoken sind zweifellos interessant.
In diesem Artikel
Direct Storage ist ein heißes Thema, da es ein weiterer technischer Evolutionsschritt ist, der für uns Spieler mehr aus der Hardware herausholt. Bei Direct Storage geht es hauptsächlich darum, die Geschwindigkeit des SSD-Speichers und der darauf basierenden Schnittstelle zu nutzen, um den CPU-Overhead zu reduzieren, der entsteht, wenn Spieldaten im Systemspeicher verschoben, dort dekomprimiert und erst dann in den Grafikkarten-Speicher kopiert werden. Direct Storage wurde entwickelt, um den Prozess der Entnahme der komprimierten Spieldaten von einem Laufwerk und das anschließende Rendern zu rationalisieren. Wer sich genauer für die Technologie dahinter interessiert, dem empfehlen wir unseren Artikel zum ersten synthetischen Benchmark für Direct Storage, in dem wir näher auf die Hintergründe eingehen. Hier soll es ausschließlich um die Spielpraxis gehen. Als Testvehikel dient uns das Action-Adventure Forspoken, welches am 24. Januar erschien. Das Spiel ist umstritten, hat aber zweifellos bildhübsche Momente - 20 Beweise dafür haben wir in der Bildergalerie geparkt:
Bildergalerie
Direct Storage kostet GPU-Leistung?
Nein, dieser mittlerweile weltbekannte Verdacht aus unserem Hands-on-Video zu Direct Storage in Forspoken hielt umfassenden Messungen nicht stand. Unsere ersten Benchmark-Stichproben haben nur scheinbar gezeigt, dass Direct Storage etwas GPU-Leistung abzwackt, was zunächst nicht unlogisch klingt, da die GPU zur Dekomprimierung genutzt werden sollte. Bei weiteren Messungen stellte sich dann heraus, dass dieses Ergebnis eine andere Ursache hatte: Wir protokollierten den gesamten integrierten Benchmark in Forspoken mithilfe unseres primären Mess-Tools CapFrameX. Dabei werden im integrierten Benchmark auch die schwarzen, mit hohen Bildraten dargestellten Ladebildschirme erfasst. Die Krux: Mit einer schnell ladenden NVME-SSD fallen diese Hoch-Fps-Phasen kürzer aus als mit einer relativ trägen SATA-SSD. So kam es zu dem viel diskutierten Ergebnis, dass Direct Storage anscheinend die Leistung senkt. Selbstverständlich war das mit einer Probe noch nicht in Stein gemeißelt, doch die Nachricht verbreitete sich wie ein Lauffeuer.
Viele Kolleginnen und Kollegen stellten daraufhin eigene Tests an und kamen ohne separates Fps-Logging zum Ergebnis, dass die These, Direct Storage koste GPU-Leistung, nicht haltbar ist. Schließlich brachte uns auch der Austausch mit unserer versierten Community im Forum auf unseren Fauxpas. Lange Rede, kurzer Sinn: Fehler passieren und nicht jede Annahme erweist sich als korrekt. Unter dem Strich hat die Sache aber etwas Gutes, denn Recherche ist ein Prozess, aus dem nicht nur wir, sondern auch andere Tester gelernt haben - nicht trotz, sondern wegen unserer schnellen Veröffentlichung. Zur journalistischen Sorgfalt gehört es aber auch, falsche Behauptungen als solche hinterher richtigzustellen, was wir mit einem Hinweis im Artikel und in der Videobeschreibung nachgetragen haben.
SATA gegen PCI-E 3.0 gegen PCI-E 4.0
Grundlagenarbeit auf neuem Terrain geschieht nicht über Nacht. Und weil das so ist, haben wir in den letzten Tagen umfangreiche Nachtests angestellt, Patches für Forspoken abgewartet und sind nun in der Lage, ein genaues Bild zu zeichnen. Dafür haben wir zahlreiche Kombinationen aus SSDs, Grafikkarten und Einstellungen abgeklopft.
Für die Ladezeiten-Messungen der drei verschiedenen SSD-Schnittstellen haben wir den internen Benchmark von Forspoken verwendet. Da die händische Stoppuhr-Methode Ungenauigkeit bei den Nachkommastellen gebracht hätte, haben wir die Werte des internen Benchmarks ausgelesen. Da hier auch die Fps mit ausgegeben werden, haben wir auch diese notiert. Der interne Benchmark misst die Ladezeiten von insgesamt sieben Szenen und spuckt diese auch aufsummiert zusammen mit den durchschnittlichen Fps in einer Logdatei aus. Um nicht Nachkomma-Unterschiede analysieren zu müssen, haben wir die griffigere Summe aller Ladezeiten fürs Diagramm hergezogen. Wir testen nicht nur die Schnittstellen, sondern auch die Auswirkungen von Direct Storage mithilfe eines Startbefehls für Forspoken - damit lässt sich das Feature ein- und ausschalten.
Als Vertreter der drei SSD-Schnittstellen haben wir jeweils drei leistungsfähige Modelle verwendet. Bei der Corsair MP600 Pro XT (PCI-E 4.0) und der WD Black SN750 (PCI-E 3.0) handelt es sich jeweils um Topmodelle. Die SATA-SSD, eine Mushkin Striker, ist zwar schon etwas betagt, aber kaum ein SATA-Modell ist das nicht. Hier ist das Schnittstellen-Maximum der Leistung ohnehin schon lange erreicht, sodass selbst aktuellere Modelle hier keinen wesentlichen Unterschied gezeigt hätten.
Die Ladezeiten-Messungen hat zwar zwischenzeitlich das ganze Internet gemessen. Nun haben sich hier auch keine neuen Ergebnisse oder Erkenntnisse aufgetan, die unsere erste Analyse von vor einigen Wochen nicht schon gebracht hätten: Der Unterschied mit und ohne Direct Storage beläuft sich auf vernachlässigbare acht bis 15 Prozent Unterschied in den Ladezeiten. Zwischen NVME- und SATA-SSDs liegt aber noch ein deutlicher Faktor. Obwohl die Ladezeiten mit SATA circa dreimal so lange dauern, wird dadurch nicht das Spielerlebnis beeinträchtigt. Stets haben wir gepredigt, dass eine SATA-SSD zum Spielen vollkommen ausreicht, was an sich noch immer der Fall ist. Nur diese Messwerte mit Direct Storage zeigen, wohin die Reise geht: Zukünftige Titel, welche die Microsoft-Technologie intensiver nutzen werden, sollten besser auf einer NVME-SSD installiert sein. Um Sie hier zu beruhigen: Das kann noch gut etwas dauern, eine mit PCI Express 3.0 wird sicherlich auch ausreichen und preislich sind SSDs aktuell ziemlich günstig, sodass sich aktuell ohnehin keine SATA mehr wirklich lohnt.
Vorschau auf PCI Express 5.0
Der Youtube-Kanal "Compusemble" hat bereits das Phison-Referenzmodell parat und veröffentlicht erste Tests. Hier handelt es sich um den Controller Phison E26, der eine Leistung um die 10 GB/s liefert. Hier hat man die PCI-Express-5.0-SSD gegen 4.0 und 3.0 im Vergleich antreten lassen und die Ergebnisse sind fürs Erste recht unspektakulär:
Die Adata XPG SX8200 Pro mit PCI Express Gen 3 liefert mit 13,8 Sekunden das langsamste Ergebnis. An zweiter Stelle steht die Samsung 990 Pro mit PCI Express Gen 4 - sie erreicht 10,9 Sekunden und ist damit merklich schneller. Der Sprung auf PCI Express 5 ist dann aber vernachlässigbar: Die Referenz-SSD mit dem Phison E26 lädt die Testszene in 10,5 Sekunden. Im genannten Messumfeld bringt der Sprung von PCI Express Gen 3 auf Gen 4 also noch einen Vorteil; der Sprung auf Gen 5 ist derweil vernachlässigbar. Der Sprung zwischen Gen 3 und Gen 4 ist zudem zwar merklich messbar und mit 32 Prozent auch deutlich, ob man nun aber in der Praxis einen Unterschied von knapp 3 Sekunden nennenswert nennen will, ist wohl am besten von jedem einzeln zu beantworten.

Fazit: Direct Storage bringt scheinbar auch für Sata SSDs minimale Vorteile. Aber richtig lohnen tut es sich erst mit NVMe SSDs.
ich meinte in dem Vergleichsvideo das in dem Artikel drin ist, wenn man alle Szenen gleichtzeitig beobachtet, sieht man es im direkten Vergleich.
Hier ein Video
https://www.google.com/se... q=Direct+Storage+Test+%2Bhd&client=firefox-b-d&biw=1493&bih=767&ei=eULpY52uNraBxc8P4uWHiAI&ved=0ahUKEwjdzuGU4JD9AhW2QPEDHeLyASEQ4dUDCA4&uact=5&oq=Direct+Storage+Test+%2Bhd&gs_lcp=Cgxnd3Mtd2l6LXNlcnAQAzoKCAAQRxDWBBCwAzoHCAAQgAQQEzoLCAAQFhAeEPEEEBM6CQgAEBYQHhDxBEoECEEYAEoECEYYAFCMBVirD2DlEGgBcAF4AIABW4gBqQKSAQE0mAEAoAEByAEIwAEB&sclient=gws-wiz-serp#fpstate=ive&vld=cid:62d55469,vid:Ifux49qqGhc,st:137
Das mit SATA hattet ihr auch noch im Artikel "Nie wieder Ladezeiten?" geschrieben.
Vielleicht kann eines Tages die Grafikkarte die Daten sogar direkt von der NVMe holen ohne einen Umweg über die Pufferung im Arbeitsspeicher. Mittels eines direkten Datentransfer zweier PCIe Geräte (Vergleichbar mit PCIe peer-to-peer). Die I/O-Einheit des CPUs müsste da nur die Ausgangs-Lanes des einen mit dem Eingangs-Lanes des anderen Gerät verbinden und die Kerne selbst hätten dabei nichts zu tun anstatt wie jetzt Daten hin und her zu schieben und temporär im RAM abzulegen.
Da bei DirectStorage nicht mehr die CPU sonder die GPU das Decodieren der Grafik-Assets übernimmt erklärt es auch warum bei einer CPU limitierten Szene die FPS höher sind und warum in diesen Fall die Geschwindigkeit des Datenträgers weniger relevant ist. Jedoch nur solange auch noch neue Daten gestreamt werden. Wäre nur die Frage warum bei der Radeon RX 6800 XT die PCIe 4.0 SSD ohne DirectStorage nicht auch einbricht wie die SATA SSD. Um ein GPU-Limit vorzubeugen und so besser die Auswirkungen auf die CPU zu zeigen, wäre ein Test mit einer Nvidia 4090 sinnvoll. Schließlich geht es hierbei primär um die Technologie und um zu zeigen, wie ein entlasteter CPU dann eventuell mit einer besseren Grafikkarte gepaart werden könnte. Dies wäre auch besonders für zukünftige DirectStorage Spiele relevant, die nicht so start wie Forspoken GPU limitiert sind.
Edit:
Durch DirectStorage steigert sich der Datendurchsatz ja nur um die Komprimierungsrate der Assets. Der Datenträger hat daher immer noch einen viel größeren Einfluss. Ist auch gut zu sehen, da DirectStorage prozendual gesehen eine ähnliche Beschleunigung beim Laden bietet. Diese nimmt zwar mit zunehmender Ladezeit ab, aber das könnte durch steigenden Overhead erklärt werden. Ein Unterschied der Dekomprimierungsrate zwischen CPU und GPU ist aktuell wahrscheinlich eher vernachlässigbar.
Edit 2:
DirectStorage sollte bei der Bildwiederholrate nur helfen, wenn es ein CPU-Limit gibt. Sofern ein Spiel daher nicht alle Kerne ausreizen kann, sollte dieses Feature keine Verbesserung bringen. Je nach Spiel wäre es daher sogar möglich, dass sofern noch ungenutzte Kerne zur Verfügung stehen DirectStorage dann ebenfalls keine Verbesserung liefert. Die Anzahl der CPU Kerne könnte daher ebenfalls sehr entscheidend sein inwieweit DirectStorage einem Spiel bei den FPS hilft.