Online-Abo
  • Login
  • Registrieren
Games World
  • Intels Richard Huddy im Interview: Haswell erlaubt einmalige Grafik in Grid 2 und Rome 2 [Artikel der Woche]

    Im Gespräch mit PC Games Hardware erläutert Richard Huddy, European Games Enabling Manager bei Intel, die Hintergründe zu Instant Access sowie Pixel Sync bei Grid 2 und gibt interessante Details über die Implementierung der beiden Haswell-Erweiterungen preis.

    Anmerkung: Dieser Artikel hatte die meisten Seitenaufrufe diese Woche. Aus diesem Grund veröffentlichen wir ihn heute erneut.
    Intels Richard Huddy im Interview (10) Intels Richard Huddy im Interview (10) Quelle: Intel Intels neue Haswell-Prozessoren legen gegenüber der Vorgängern-Generation nicht nur bei der reinen Grafikleistung deutlich zu, sondern bieten auch zwei exklusive Erweiterungen für DirectX, welche Funktionen bereitstellen, die Microsoft bisher nicht in die Schnittstellen-Sammlung integrierte. Hierbei handelt es sich um Instant Access, auch DRA (Direct Ressource Access) genannt, und Pixel Sync, welche zusammen eine aufgewertete Optik in Grid 2 und Rome 2 erlauben. Intel und Codemasters sowie Creative Assembly arbeiteten hier eng zusammen um bei möglichst geringem Leistungsverlust die Grafik sowie das Spielgefühl zu verbessern.

    Intels Richard Huddy im Interview: Intels Richard Huddy im Interview: Quelle: Intel Wir wollten es genauer wissen und baten Intels Richard Huddy, European Games Enabling Manager, zum Interview rund um Grid 2, Rome 2, Instant Access sowie Pixel Sync. Richard selbst arbeitet seit 1996 in der Hardware- sowie Gaming-Branche, beispielsweise bei 3D Labs, bei Nvidia und von 2002 bis 2011 bei Ati respektive AMD. Er unterstützt Spiele-Entwickler bei der Integration von Features und Performance, eines seiner Highlights ist laut eigener Aussage Battlefield 3.

    Intels Richard Huddy im Interview: DirectX ist ein "Fire and Forget"-Modell

    Wichtig für Instant Access und Pixel Sync ist der DirectX-Hintergrund. Richard erläutert, dass die Schnittstelle seit jeher mit Fokus auf diskrete Grafikkarten entwickelt und Funktionen, welche diese beiden proprietären Erweiterungen bei allen Haswell-Grafikeinheiten bieten, fehlen noch in der Sammlung - der European Games Enabling Manager aber betont, "wir wären mehr glücklich, wenn Microsoft derartige Optionen in ein künftiges DirectX integrieren würde". Daten werden zumeist per AGP oder PCI-Express von der CPU zur Grafikkarte geschickt, was sehr schnell geschieht - in die andere Richtung aber kommt die Kommunikation schnell ins Stocken. Entwickler müssen also in erster Linie die GPU einspannen, ein ständiger Datenaustausch hingegen wird aus Performance-Gründen vermieden und es werden Workarounds verwendet. Im Falle eines Prozessors mit integrierter Grafikeinheit stellt sich dieses Problem nicht, sofern CPU und GPU wie im Falle von Intel per Ringbus sowie gemeinsamen Last Level Cache (LLC) kommunizieren können, teilweise sogar ohne den Systemspeicher zu beanspruchen.

    Intels Richard Huddy im Interview: Instant Access verhindert Stottern und ist schnell programmiert

    Intels Richard Huddy im Interview (3) Intels Richard Huddy im Interview (3) Quelle: Intel Somit sind neue Algorithmen sinnvoll einsetzbar, wovon man vor allem die nächsten zwei bis drei Jahre einige sehen wird. "Spiele-Entwickler sind signifikat kreativer als ich, denn ich kenne zwar meine Technik, aber da draußen gibt's einige derart kreative Köpfe, welche Dinge erschaffen können, die wir uns beim Designen der GPUs nicht einmal erhofft haben", gibt Richard zu und fügt hinzu, "es gibt sehr offensichtliche Dinge, etwa das Streamen von Daten von der Festplatte oder der DVD. Normalerweise müsste man hier den PCI-Express-Bus in Richtung Grafikkarte bemühen, aber mit Instant Access können wir das doppelt so schnell erledigen". Dadurch steige zwar die durchschnittliche Framerate nicht drastisch an, aber das Stottern wenn nachgeladen wird, verschwindet nahezu und "dies ist einer der größten Vorteile, die wir bieten können". Schließlich seien die Einbrüche der Framerate, welche das Spielerlebnis trüben würden und genau das verhindert Instant Access - wenngleich Richard anmerkt, dies sei "schwer zu messen, aber spürbar beim Spielen". Für die Studios sei diese Erweiterung zudem einfach zu implementieren, "es dauert normalerweise keine Woche und wir erwarten, dass viele [Entwickler] dies nutzen werden".

    Auf die Frage hin, inwiefern sich Instant Access von AMDs Zero Copy unterscheide, stellt Richard klar, "hier bestehen in der Praxis nur wenig Unterschiede" und er betont erneut, "ich bin mir sicher, auch unsere Mitbewerber würden es begrüßen, wenn eine derartige Funktion Einzug in DirectX halten würde". Intel habe nur aus diesem Grund Instant Access als proprietäre Erweiterung konstruiert, denn im Prinzip seien sich beide Techniken sehr ähnlich.

    Intels Richard Huddy im Interview: Pixel Sync für transparente Objekte

    Intels Richard Huddy im Interview (4) Intels Richard Huddy im Interview (4) Quelle: Intel Die zweite Erweiterung, Pixel Sync, sei "schwieriger zu erklären und zu verstehen, ich muss daher mit DirectX 11 beginnen". Diese Schnittstelle brachte die Idee eines UAV mit sich, eines Unordered Access Views, einem wichtigen Bestandteil der API. Ein Access View ist ein Render Target, welches bestimmt wie Polygone berechnet werden. "Es gibt eine Regel bei DirectX und die besagt, die Dreiecke müssen in der Reihenfolge im Framebuffer erscheinen, wie sie übermittelt werden". Dies wichtig um überhaupt die notwendigerweise deterministischen, also streng festgelegten Resultate zu erzielen, welche die DX-Schnittstelle vorsieht, "denn nur so erhält man die gleichen Pixeln wenn man die Szene ein zweites Mal berechnet". Die passiere beispielsweise dann, wenn man ein Spiel pausiere - die Physik wird angehalten, aber der Renderer arbeitet weiterhin und stellt ständig die identische Szene dar.

    Polygone kommen wie bereits erwähnt nur einer deterministischen Reihenfolge durch die Pipeline, würden sich die Entwickler daran nicht halten, so gibt es massive Darstellungsprobleme. Hier kommt nun Pixel Sync ins Spiel, denn dieses erlaubt eine bessere Darstellung transparenter Objekte. Ein bekannter Fall ist Hidden Surface Removal, also das Aussortieren von Objekten in Hardware, die von anderen verdeckt werden (Prüfung des Z-Buffers), wobei entsprechende Polygone verworfen und nicht berechnet werden. Ein Unordered Access View zeichnet, wie es der Name impliziert, Polygone in einer beliebigen Reihenfolge und gestattet damit keine glaubwürdigen Transparenzen - außer mit Workarounds, etwa reduzierte Qualität und Approximation. "Wenn du zwei gläserne Fenster hintereinander versuchst darzustellen, dann klappt dies nicht mit DirectX, denn die API erlaubt keine geordneten Transparenzen". Daher gibt die sogenannte Order Independant Transparency (OIT), bei welche die Reihenfolge der angelieferten Transparenzen nichts zur Sache tut, sie werden dennoch korrekt ausgegeben. DirectX selbst bietet keine OIT, nur eben die eingangs erwähnten UAVs und in Zusammenarbeit mit den Linked Lists von DX11 ist OIT möglich, allerdings mit enormem Leistungshunger.

    Einer der größten Befürworter von Order Independant Transparency sei Johan Andersson, der Technical Director für die Frostbite-Engine bei DICE, dem Entwickler von Battlefield 4. Laut ihm sind bespielsweise keine gläsernen Häuser möglich, selbst Scheiben in Autos seien nur sehr schwierig mit Workarounds zu berechnen. Wer etwa an einer Ecke eines Cafés diagonal durch zwei Scheiben schaut und die Querstraße (samt Gegner) sehen möchte, der kann dies ohne Grafikfehler nicht zeichnen. "Johan kann nicht das erschaffen, was er und seine Artists möchten". Daher sei es ihm wichtig, Zugriff auf Order Independant Transparency zu haben, inklusive dem Wissen über die Performance und den Speicherbedarf - letzterer darf nicht zu hoch sein.

    Pixel Sync nun erlaubt trotz den UAVs eine korrekte OIT, was laut Richard Huddy nur als Erweiterung möglich sei, das DirectX 11 dies eigentlich nicht vorsehe. "Wir können OIT bei Haswell mit einem recht geringen Leistungsverlust darstellen", so der European Games Enabling Manager. "Wenn du dir unsere Samples anschaust, so wirst du bemerken, dass diese alle ein A für Adaptive voranstehen haben - genau das erlaubt es uns, die Performance aktzeptabel zu gestalten". Die AOIT, also Adaptive Order Independant Transparency, erlaubt es dem Entwickler wie viele Pixel er im Endeffekt berechnen und darstellen möchte. "Um die Brücke zu Grid 2 zu schlagen, AOIT ermöglicht Licht und Schatten auf Rauch - nämlich Adaptive Volumetric Shadow Maps".

    Intels Richard Huddy im Interview: Grid 2 bietet beleuchteten Rauch, der fantastisch aussieht

    Intels Richard Huddy im Interview (9) Intels Richard Huddy im Interview (9) Quelle: Intel Man habe mit Codemasters zusammenarbeitet und so dank Pixel Sync zwei exklusive Grafik-Effekte in deren Rennspiel einzubauen: "Mit Adaptive Order Independant Transparency stellen wir Laub oder genauer gesagt Blätter dar und zwar mit weicheren Kanten bei hoher Geschwindigkeit sowie sehr hoher Qualität." Die rote Färbung hat übrigens nichts mit Herbst zu tun, sondern veranschaulicht nur, wo AOIT zum Einsatz kommt. Neben der Laub-Berechnung nutzt die Grid-2-Entwickler die DX11-Erweiterungen für Rauch, der bei durchdrehenden Reifen entsteht oder aus dem Auspuff kommt. "Früher nutzt man hierfür einfach eine graue Textur, Rauch aber sollte ausgeleuchtet werden, inklusive Schatten und sich ändernden Lichtverhältnissen bedingt durch den Sonnenstand", so Richard und zeigt sich begeistert, denn "das [AVSM] sieht einfach viel besser aus und es funktioniert nur mit Intels Pixel Sync". Ohne die Erweiterung gäbe es flackernde Schatten, zudem würde man 400 MiByte Speicher benötigen statt nur die zwei- bis dreifache Größe des Screens Spaces.

    Auf die Problematik angesprochen, dass AOIT und AVSM derzeit nur für die Iris Pro Graphics 5200 zur Verfügung steht (obwohl alle Haswell-GPUs Instant Access und Pixel Sync beherrschen), ist Richard anderer Ansicht: "Das sollte nicht der Fall sein und ich glaube nicht, dass Grid 2 dich davon abhält, beides zu aktivieren - es ist höchstens von Haus nicht aktiv". Wir zeigen ihm die ReadMe-Datei und er fügt hinzu: "Die Hardware ist in der Lage die beiden Optionen zu berechnen, der Leistungsverlust beträgt nur etwa zehn Prozent. Bei den langsameren Grafikeinheiten willst du natürlich nicht so niedrige Framesrate - aber das ist eine Entscheidung der Entwickler". Wir stehen diesbezüglich mit Intel und Codemasters im Gespräch. Ein Statement ist angefragt, das Interview fand am 13. Juni statt - bisher konnte uns Intel bereits bestätigen, dass die Effekte durch die Bank auf allen Haswell-GPUs funktionieren. Update : Die aktuelle Grid-2-Version erlaubt beide Effekte auf jeglichen HSW-Grafikeinheiten.

    before
    after

    Intels Richard Huddy im Interview: Eine "wunderschöne" Römer-Schlacht im Wald

    Intels Richard Huddy im Interview (11) Intels Richard Huddy im Interview (11) Quelle: Creative Assembly Für Rome 2 Total War von Creative Assembly gibt es basierend auf Instant Access und Pixel Sync zwei Effekte zu bewundern, wie Richard ausführt: "Du wirst vor allem auf der Kampagnen-Karte ein verringertes Stottern sehen, da hier viele Daten zwischen GPU und CPU bewegt werden - das habe ich bei einer der letzten Beta-Versionen gesehen, also nagel mich nicht darauf fest. Weiterhin wird die Berechnung von Laub in den Wald-Schlachten beschleunigt sowie verbessert, das sieht wirklich toll aus. Ich weiß allerdings nicht, wie die Entscheidung ausfällt, welche Haswell-GPUs davon profitieren respektive freigeschaltet ich - mein Rat wäre, es für alle zur Verfügung zu stellen".

    Da die Iris Pro Graphics 5200 einen Embedded-DRAM bietet, interessierte uns abschließend, ob dieser auf eine spezielle Art und Weise verwendet wird. "Das ist schlicht eine Optimierung der Leistung. Wir haben viel Zeit damit verbraucht, mit den Entwicklern zu sprechen, ob sie den EDRAM als programmierbaren Caches nutzen möchten. Es gab tatsächlich einige Fälle, aber der Aufwand hierfür wäre ziemlich hoch. Auch die nötige Arbeit am Treiber-Code kostet viel Zeit, es erschien und daher sinnvoller, den EDRAM als Cache zu nutzen - es ist aber möglich, in Zukunft Optimierungen zu entwickeln." Wir jedenfalls sind gespannt, wie Rome 2 sich auf Haswell-GPUs spielt.

    Wissenswert: Mehr Informationen zum Thema finden Sie in:
    AMD Zen ab 2017: Alles zu Release-Termin, CPU-Sockel, technische Daten [Update]
  • Stellenmarkt

    Es gibt 50 Kommentare zum Artikel
    Von Locuza
    Auf so eine GPU-Power wird man natürlich noch verdammt lange warten müssen. CPUs werden aber in der Zukunft vom Die…
    Von Cook2211
    Zu faul. Außerdem hat man meistens die News gerade fertig, schon berichtet PCGH ebenfalls darüber.
    Von Threshold
    Mach doch eine User News.
    Von Cook2211
    Ich weiß, ist OT, wollte das auch nur als zusätzlichen Hinweis einbringen, dass NV eher nicht in Richtung x86 geht,…
    Von Skysnake
    Die hätten schon gern gewollt, wenn man dem glauben schenkt, was Ailuros im 3D-Center so erzählt, und der hat recht…
      • Von Locuza Lötkolbengott/-göttin
        Zitat von Blackvoodoo
        Also ich kann mir nicht vorstellen das jemals so eine GPU Power wie z.b. von der Titan auf einer CPU zu finden sein wird. Warum soll nVidia keine x86 APU bauen können? Ich glaube die könnten schon wenn sie müssten. Nur vermutlich sehen die da noch keinen Sinn.
        Auf so eine GPU-Power wird man natürlich noch verdammt lange warten müssen.
        CPUs werden aber in der Zukunft vom Die-Space relativ immer weniger Platz einnehmen und die GPU immer mehr.
        Wenn man sich anschaut, was der durchschnittliche Gamer hat, kann man das mit einer APU bei der GPU und CPU schon erreichen.
        Es hat halt bisher niemand die "Lust" gehabt, eine APU zu fertigen die über ~250mm² geht.

        Aber vor allem Intel ist in einer guten Position, viel CPU-Power und gute GPU-Power zu verbauen.
      • Von Cook2211 Kokü-Junkie (m/w)
        Zu faul. Außerdem hat man meistens die News gerade fertig, schon berichtet PCGH ebenfalls darüber.
      • Von Threshold Flüssigstickstoff-Guru (m/w)
        Zitat von Cook2211

        Aber das wird dann ausdiskutiert, wenn PCGH die News bringt

        Mach doch eine User News.
      • Von Cook2211 Kokü-Junkie (m/w)
        Ich weiß, ist OT, wollte das auch nur als zusätzlichen Hinweis einbringen, dass NV eher nicht in Richtung x86 geht, sondern lieber selber lizenziert, aus welchen Gründen auch immer.
        Aber das wird dann ausdiskutiert, wenn PCGH die News bringt
      • Von Skysnake Lötkolbengott/-göttin
        Zitat von Threshold

        Da Nvidia aber auf ARM setzt denke ich mal dass sie dort eher investieren als plötzlich zweigleisig fahren zu wollen.
        Die hätten schon gern gewollt, wenn man dem glauben schenkt, was Ailuros im 3D-Center so erzählt, und der hat recht gute Kontakte/Quellen bei nVidia. Angeblich hat nVidia sogar mit x86 Emulation angefangen, um dann einen aufs Dach zu bekommen und als Folge daraus gezwungenermaßen auf ARM um zu schwenken.

        Zitat von Cook2211
        Nvidia beginnt jetzt die eigenen Prozessoren bzw. Architekturen zu lizenzieren. Angefangen werden soll das jetzt mit Kepler:

        Nvidia lizenziert GPU-Technologie für Drittanbieter - ComputerBase
        Verzweiflungstat meiner Meinung nach, weil Sie einfach keinen Fuß auf den Boden bekommen im SFF-Markt. Die Konkurrenz da ist einfach mörderisch...

        Eventuell sollte ma das nVidia Thema aber wo anders besprechen. Gehört nicht wirklich hier dazu.
  • Print / Abo
    Apps
    PC Games Hardware 01/2017 PC Games 12/2016 PC Games MMore 01/2016 play³ 01/2017 Games Aktuell 12/2016 buffed 12/2016 XBG Games 11/2016
    PCGH Magazin 01/2017 PC Games 12/2016 PC Games MMORE Computec Kiosk On the Run! Birdies Run
article
1074256
Haswell
Intels Richard Huddy im Interview: Haswell erlaubt einmalige Grafik in Grid 2 und Rome 2 [Artikel der Woche]
Im Gespräch mit PC Games Hardware erläutert Richard Huddy, European Games Enabling Manager bei Intel, die Hintergründe zu Instant Access sowie Pixel Sync bei Grid 2 und gibt interessante Details über die Implementierung der beiden Haswell-Erweiterungen preis.
http://www.pcgameshardware.de/Haswell-Codename-255592/News/Intel-Richard-Huddy-Interview-Haswell-Grid-2-Rome-2-1074256/
22.06.2013
http://www.pcgameshardware.de/screenshots/medium/2013/06/Intel-Haswell-Grid-2-08-pcgh.jpg
haswell,race driver grid 2,total war rome 2
news