Hitman 2016 PC: DirectX 11 vs. DirectX 12 - Benchmarks: DX12 als CPU-Entlaster [Update 3]
Nach The Division erscheint mit Hitman (2016) diese Woche ein weiterer Hit-Kandidat, der darüber hinaus auch schon mit optionaler DirectX-12-Unterstützung an den Start geht. PC Games Hardware konnte bereits vorab ein paar Meuchelmorde begehen und DirectX 11 mit DirectX 12 vergleichen.
Der Hitman von Io-Interactive/Square Enix bekommt 2016 den Auftrag zum Reboot. Gestartet wird am 11. März mit einer ersten Episode und dem Tutorial (Intro Pack genannt), weitere Hitman-Episoden folgen in den kommenden Monaten. Das Episodenformat sorgte nicht nur für ungeteilte Begeisterung, zumal IO Interactive auch noch die Inhalte der ersten "Episode" zusammenstrich. Sollten ursprünglich drei Sandbox-Level im Intro Pack enthalten sein, ist es jetzt eben nur einer, der in Paris spielt. Insgesamt sind sechs solcher Sandbox-Level mit unterschiedlichen Szenarien anvisiert, die im Laufe der kommenden Monate veröffentlicht werden und so das Spiel ergänzen. PC Games Hardware konzentriert sich in diesem Artikel auf die Technik des neuen Hitman: Erstmals ist Agent 47 auch optional mit DirectX 12 unterwegs, wir vergleichen die Leistung zum Standard-DX11-Renderpfad.
Hitman (2016) PC: Die Technik
In Hitman kommt nach wie vor die Glacier-Engine von IO Interactive zum Einsatz. Hitman 2016 bietet nun einen physikbasierten Renderansatz, welcher eine realistischere Darstellung von Materialeigenschaften erzielt aus herkömmliche Rendermethoden. Multisample-AA gibt es nicht, dafür bietet die Engine nun neben FXAA auch SMAA inklusive temporaler Verrechnung. Beide Verfahren lassen sich stufenweise mit spielinternem Supersampling mittels erhöhter Renderauflösung kombinieren (Ingame-Downsampling). DirectX 12 gab es in der Hitman-Beta noch nicht, aber in der finalen Fassung ist der alternative Renderpfad neben DirectX 11 nun drin. Über die Nutzung von DX12 in Hitman ist bekannt, dass sie verbessertes Multithreading, mehr Leistung bei CPU-Limitierung, ein besseres Spielerlebnis für Gamer mit Laptops und die Unterstützung von Asynchronous Compute auf AMD-Grafikkarten bieten soll. Die Unterstützung von DirectX 12 befindet sich wohl aber noch in einer frühen Phase und soll in zukünftigen Veröffentlichungen ausgebaut und weiter verbessert werden.
Hitman (2016) PC: Systemanforderungen
Minimal reicht für Hitman ein Mittelklasse-PC mit einem Core i5 der Sandy-Bridge-Generation oder einem Phenom II X4. Grafikkarten werden ab Nvidias Kepler- und AMDs GCN-Generation vorausgesetzt, wobei es sich mit der Geforce GTX 660 und HD 7870 beziehungsweise R9 270(X) um Mittelklasse-GPUs handelt. Der Arbeitsspeicher muss mindestens 8 GiByte umfassen.Die Empfehlungen sehen schon anders aus, hier setzt man auf eine durchaus starke CPU, nämlich auf einen Core i7 ab der Ivy-Bridge-Generation beziehungsweise einen hochgetakteten Vishera-Viermoduler. Als Grafikkarte darf es eine Geforce GTX 770 oder Radeon R9 290 sein. Traditionell werden bei IO-Interactive-Titeln stärkere Radeons als Geforces genannt, obwohl es sich um Spiele aus AMDs Gaming-Evolved-Programm handelt. Die RAM-Empfehlung bleibt mit 8 GiByte unverändert.
Interessant an den Systemanforderungen ist die Abstinenz von DirectX 12. Empfohlen wird die Version 11 sowie ein 64-Bit-Betriebssystem ab Windows 7, allerdings unterstützt erst Windows 10 DX12. Immerhin werden bei den minimalen Systemanforderungen DX12-kompatible GPUs genannt. Die naheliegende Vermutung: Die starken CPUs gelten bei Nutzung von DirectX 11, der Nachfolger entlastet den Prozessor ja bekanntlich.
| Hitman (2016) | Hitman: Absolution (2012) | |
|---|---|---|
| Minimum | ||
| Betriebssystem | Windows 7 (64 Bit) | Windows Vista / 7 |
| Prozessor | Core i5-2500K, Phenom II X4 940 | "Echter" Dual-Core |
| Grafikkarte | Geforce GTX 660, Radeon HD 7870 (R9 270[X]) | Geforce 8600 (GT), AMD-Aquivalent |
| Arbeitsspeicher | 8 GiByte | 2 GiByte |
| Empfohlen | ||
| Betriebssystem | Windows 7, 8.1, 10 (je 64 Bit) | Windows 7 (64 Bit) |
| Prozessor | Core i7-3770, FX-8350 | Core i7*, Athlon II X4 |
| Grafikkarte | Geforce GTX 770, Radeon R9 290 | Geforce GTX 260, Radeon HD 5770 |
| Arbeitsspeicher | 8 GiByte | 4 GiByte |
Hitman (2016): Grafikkarten-Benchmarks und DirectX-12-Probleme
Gerne hätten wir eine direkte Gegenüberstellung von Direct X 11 und Direct X 12 anfertigt, doch leider ist dies nicht so einfach möglich. Mit AMD-Grafikkarten greift die Windows Composing Engine in das Messverfahren ein, das Problem dabei wird bei PC Per anschaulich beschrieben. In Kurzform: Mit Direct X 12 wird die Framerate unter Windows an die maximale Wiederholfrequenz des Monitors gekoppelt. So wird zwar Tearing vermieden, aber auch der Spieler entmündigt, denn umgehen lässt sich das Lock mit AMD-Grafikkarten nur im Fenstermodus, nicht im Borderless Window und nicht im Fullscreen. Im Fenstermodus greifen aber die im Spiel eingestellten Auflösungen nicht, im Fenster ermittelte Werte können zudem von jenen im Fullscreen abweichen. Mit unserem Display und einer Radeon hat Hitman unter DX12 daher ein 60-Fps-Lock. Das gilt auch für den integrierten Benchmark, der zudem unrealistisch hohe Werte ausgibt. Nvidia-Grafikkarten können sich offenbar mittels FlipEx-Workaround um die VSync-Problematik herumdrücken, wie verlässlich die ausgegebenen Werte sind, ist allerdings auch nicht klar.
UPDATE 1: Performance-Probleme mit AMD, Abstürze bei Nvidia gelöst, neue Benchmarks!
Es ist uns gelungen, das Framelock und die schlechte Performance mit AMD-GPUs und die Abstürze mit Nvidia-GPUs unter Direct X 12 zu beheben. Im Startmenü des Spiels wird bei Direct X 12 eine zusätzliche Option aktiv: Steht "Render Target Reuse" wie vorgegeben auf "automatisch", läuft Hitman unter Direct X 12 wie oben beschrieben. Deaktivieren wir diese Option, läuft das Spiel hingegen sauber, das AMD-Framelock entfällt, die Low-Level-API läuft nun offenbar wie angedacht. Wir aktualisieren nun die Benchmarks, ersetzen die alten Messungen und revidieren unsere Aussage - Hitman läuft nun durchaus geschmeidig und kann nach ersten Erkenntnissen auch recht deutlich von DX12 profitieren. Als erste Karte präsentieren wir Ihnen die sehr stark abschneidende Powercolor R9 390 PCS+/8G, farblich in den Benchmarks hervorgehoben. Wir werden alle bisher getesteten Grafikkarten mit den angepassten Einstellungen nochmals Kontrolle messen und die Werte entsprechend anpassen.
UPDATE 2: Nur Fiji und Tonga vom Framelock betroffen, Problem besteht weiterhin
Leider haben wir uns zu früh gefreut. Das Framelock unter Direct X 12 bei Fiji (Radeon R9 Fury/Nano) bleibt bestehen, außerdem betroffen ist Tonga (R9 380[X], 285). Bei Hawaii hingegen (R9 390[X]/290[X]) sind die Frameraten wie unter Direct X 11 unlimitiert. Eventuell geht dies auf einen Treiberfehler zurück. Damit sind Messungen nur begrenzt sinnvoll, ein Nachtest wäre nötig. Wir haben AMD bereits in Kenntnis gesetzt und warten auf Rückmeldung. Wir ergänzen unsere Benchmarks an dieser Stelle mit der R9 280X, die alte Tahiti-GPU kann allerdings nicht wirklich von Direct X 12 profitieren, sie beherrscht nur das Featurelevel 11_0. Zudem beschränkt Hitman unsere Einstellungsmöglichkeiten wie schon in der Beta: Mit 3 GiByte Speicher stehen lediglich hohe Texturdetails zur Verfügung, zudem können wir als maximale Auflösung 1.920 × 1.080 auswählen. Wir haben außerdem unter Direct X 12 mit der HIS R9 390X IceQ X²/8G einen verhältnismäßig hoch getakteten Hawaii-Vollausbau gemessen, der sich erwartungsgemäß nah an die GTX 980 Ti heranschieben kann. Weitere Grafikkarten, darunter GTX 970, GTX 780 Ti und R9 280/270X, folgen morgen. Wir haben außerdem Hoffnung, dass wir bis dahin einen Lösungsansatz für das Problem mit dem Framelock bei Fiji und Tonga präsentiert bekommen. Das Abschneiden der Hawaii-GPUs suggeriert zumindest ein starkes Potenzial für Leistungsgewinne unter Direct X 12, leider lässt sich dies momentan noch nicht durch Ergebnisse mit anderen Radeon-GPUs validieren. Mit Blick auf das sehr knappe Performance-Verhältnis zwischen Hawaii und GM200 muss Nvidia zumindest eingeräumt werden, dass noch kein angepasster Geforce-Treiber für Hitman und Direct X 12 erschienen ist, während AMD und die angepasste Radeon Software 16.3 Non-WHQL zur Verfügung stellte.
UPDATE 3: Workaround für das Framelock auf Fiji und Tonga
Mit einer Prise Investigativjournalismus sowie regem Schriftverkehr und Gedankenaustausch mit AMD konnten wir nun tatsächlich einen etwas exotischen Workaround für die Framelock-Problematik erarbeiten. Und so funktioniert das Ganze: Ein 144-Hz-Display muss zusätzlich zum UHD-Display unseres Testsystems angeschlossen werden, die maximale Auflösung spielt dabei keine Rolle. Nun muss der 144-Hz-Monitor als Primäranzeige konfiguriert, schlussendlich dann im Launcher von Hitman die Anzeige auf das Sekundär-Display gelegt werden. Nun entfällt auch im exklusiven Vollbildmodus das 60-Fps-Lock. Ob es sich hierbei um einen Treiberfehler oder einen Bug im Spiel handelt, ist noch unklar, an der Beseitigung des Problems wird aber gearbeitet. Es wird in absehbarer Zeit also entweder ein Update des Spiels oder ein Hotfix der Radeon Software 16.3 erscheinen. Und wir können Ihnen nun Benchmark-Werte für AMDs modernste GCN-GPUs liefern, beginnend mit einer Sapphire Radeon R9 Fury Nitro/4G, die in Full HD eine überzeugende Leistung liefert. Um den Speicherhunger des Spiels etwas transparenter darzulegen, haben wir außerdem eine Sapphire R9 290 Tri-X OC/4G gegengetestet. Nun ebenfalls ergänzt: AMDs Tonga-Vollausbau in Form der leicht übertakteten Powercolor R9 380X Myst/4G und Nvidias beschnittener GM204 in Form er kräftig boostenden Gainward GTX 970 Phoenix/3,5+0,5G. Interessanter Weise haben beide Grafikkarten unter Direct X 12 geringere Performance als unter Direct X 11, im Falle der GTX 970 ist dies allerdings analog zu den meisten anderen Nvidia-GPUs. Die R9 380X wird eventuell schon unter DX11 sehr gut ausgelastet - so sehr, dass asynchronous Compute eventuell schon leicht bremst. Dies wäre jedenfalls eine logische Erklärung: Ist eine GPU schon am Leistungslimit, bringt auch die Aufsplittung und Auslagerung von Arbeitsvorgängen kaum oder keinen Leistungszugewinn, eventuell geht sogar etwas Performance verloren. In diesem Aspekt ist asychronous Compute Hyperthreading nicht unähnlich.
Weitere Benchmarks sind in Arbeit.
Wir geben einige von uns ermittelte DX12-Werte an, allerdings mit einem großen, rot blinkenden Fragezeichen versehen: Keiner dieser Werte ist verlässlich. Zudem gibt es unter DX12 noch andere Probleme. Auf einem unserer Testsysteme stürzte Hitman mit Nvidia-GPUs reproduzierbar beim Leveleintritt ab, auf dem anderen liefen die Nvidia-GPUs offenbar problemlos. Allerdings kostet hier DX12 ab WQHD Leistung - was wiederum der Windows Composing Engine geschuldet sein könnte, die dem Spiel einen Teil der Speicherverwaltung entzieht. Mit AMD-Grafikkarten ließ sich Hitman unter Direct X 12 nur im Fenstermodus starten. Dem Baustellenzustand von Hitman unter Direct X 12 geschuldet können wir statt den sicher schon sehnlichst erwarteten DirectX-12-Benchmarks momentan leider nur reguläre DX11-Benchmarks mit brauchbaren Ergebnissen erarbeiten. Diese werden wir baldmöglichst ergänzen, zudem werden wir uns weiterhin mit der DirectX-12-Problematik beschäftigen. Wir bitten um etwas Geduld.
Hitman Final GPUs
|
|
|
-
Resolution/AA (1 von 4)
-
0 von 14 Produkten sichtbar
Hitman (2016): DirectX 12 als Prozessor-Entlaster
Blenden wir die Probleme rund um das Framelock einmal aus. Einer der Hauptgründe für eine Low-Level-Schnittstelle ist der reduzierte Overhead, von dem auch GPUs profitieren, die nicht mit dem vollen Feature-Level 12_1 ausgestattet sind. Als Overhead wird der Verwaltungsaufwand bezeichnet, den der Prozessor bewältigen muss, um der Grafikkarte Render-Anweisungen (Calls) zu geben. Wir haben uns angesehen, ob DirectX 12 im CPU-Limit Vorteile hat - und was passiert, wenn dieses nicht mehr vorherrscht.
Als Testrechner kommt ein Core i7-5820K nebst Geforce GTX Titan X @ 1.500/4.200 MHz zum Einsatz, auf dem Windows 10 x64 in der aktuellen Version installiert ist. Um ein vollständiges Prozessorlimit zu erzielen, setzen wir nicht nur die stark übertaktete Grafikkarte ein, sondern reduzieren außerdem den Takt der CPU-Kerne auf 2,5 respektive 1,2 GHz (Stromsparmodus). Die niedrige 16:9-Auflösung 1.280 × 720 ohne AA/AF stellt sicher, dass der Prozessor dieselbe Arbeit zu verrichten hat wie in üblichen Auflösungen, die geringe Pixelmenge entlastet nur die Grafikkarte. Letztere muss erst in der zweiten Testreihe schwer arbeiten: Wir erhöhen die Pixelzahl auf 3.840 × 2.160 und aktivieren außerdem das spielinterne T-SMAA sowie 16:1 AF. Werfen wir zunächst einen Blick auf die Messreihe im absoluten CPU-Limit:
Hitman: DX11 vs. DX12 in 720p
Quelle: PC Games Hardware
Der Verlauf, welchen wir wie die Grafikkarten-Benchmarks in der Mission "Showstopper" aufgezeichnet, aber auf 30 Sekunden verlängert haben, spricht eine deutliche Sprache: Unter DX12 erzielt derselbe Prozessor wesentlich höhere Durchschnitts-Fps als unter DX11. Das Spielgefühl fällt jedoch nicht besser aus, sondern tendenziell schlechter. Die Ursache dafür ist die sehr unregelmäßige Bildausgabe unter DX12, es kommt immer wieder zu Slowdowns, die klar fühlbar und vor allem im roten Verlauf sichtbar sind. Unter DX11 ist die Bildverteilung wesentlich ruhiger, allerdings kann der auf 1,2 GHz gedrosselte Prozessor hier dennoch keine ordentliche Bildrate erzeugen. Anders sieht es mit 2,5 GHz aus, hier genügt die DX11-Leistung für 55 Durchschnitts-Fps. Nun verlagern wir die Hauptlast auf die GPU, Ultra HD mit bestmöglichem AA und AF ist angesagt:
Hitman: DX11 vs. DX12 in 2160p
Quelle: PC Games Hardware
Im Direktvergleich mit 1,2 GHz tritt das Erwartete ein: Die Bildraten sind beinahe deckungsgleich. Das rührt daher, dass sowohl unter DX11 als auch unter DX12 immer noch die Prozessorleistung limitiert, ergo nur ein partielles Grafiklimit vorherrscht. Das ändert sich beim Wechsel auf 2,5 GHz Kerntakt, der praxisnäheren Einstellung. Die hohe Pixellast führt dazu, dass die um 108 Prozent erhöhte Prozessorleistung zu großen Teilen verpufft; die großen Frame-Differenzen, welche bei 720p oben zu sehen sind, werden komplett geglättet. Kontraintuitiv - aber von unseren eingangs getätigten Benchmarks bestätigt - wirkt die Tatsache, dass DX12 im Grafiklimit zu geringeren Bildraten führt als DX11. Das betrifft jedoch voraussichtlich nur Geforce-Grafikkarten, Radeon-Chips legen laut unseren obigen Benchmarks unter DX12 konsequent zu. Weitere Messungen werden folgen.
Die Grafikkarten-Testmethodik von PCGH
Basierend auf Leser-Feedback verwendet PC Games Hardware für Spiele-Benchmarks seit rund zwei Jahren keine Referenz-Grafikkarten mit Standard-Taktraten mehr - zumindest was aktuelle Modelle angeht. An ihre Stelle treten Hersteller-Modelle samt werkseitiger Übertaktung, wie sie von einem Großteil unserer Community verwendet werden. Hierbei handelt es sich um typische Modelle, wenngleich "typisch" gar nicht so einfach zu definieren ist. Die Auswahl richtet sich nicht nur daran, welche Grafikkarten noch im PCGH-Testlabor anwesend sind, sondern auch, ob sie repräsentativ für das jeweilige Modell sind: Wir nutzen nach Möglichkeit weder unübertaktete, sich wegen Überhitzung drosselnde oder enorm schnelle Herstellerdesigns, sondern "Vernunftversionen", wie wir sie auch in den PCGH-Grafikkartentests meistens empfehlen. Beachten Sie bitte, dass wir nicht sämtliche Modelle am Markt testen können, sondern uns auf eine Auswahl beschränken müssen. Auch behalten wir uns vor, einzelne hier herangezogene Herstellerkarten in anderen Tests auszutauschen, beispielsweise dann, wenn sie das Testlabor verlassen müssen.
Jede Grafikkarte wird vor den Benchmark-Durchläufen einer Aufheizperiode unterzogen, während derer sich der Kerntakt (Boost) auf ein bestimmtes, von Modell zu Modell unterschiedliches Niveau absenkt. Auf diese Weise vermeiden wir unrealistisch hohe Werte: Eine gerade aus dem Regal genommere Grafikkarte, noch kalt vom Nichtstun, boostet höher als im normalen Betrieb nach einiger Zeit unter Last. Das betrifft vor allem Geforce-Grafikkarten; die Frequenzen der meisten Radeon-Modelle bleiben auch nach dem Aufheizen unverändert - es sei denn, die Leistungsaufnahme ist der Limitfaktor. Die durchschnittliche Frequenz beim Test der jeweiligen Karten finden Sie in den Benchmarks.





