Arc A770/750 Nachschlag: Beim Raytracing schneller als RTX 3060 Ti und RX 6700 XT?
Ab dem 12. Oktober stehen Intels langersehnte Gaming-Grafikkarten Arc A770 und A750 in den Händlerregalen. Im PCGH-Test offenbarten die Neulinge eine ausgeprägte Raytracing-Stärke, welche wir im Folgenden noch etwas genauer abklopfen wollen. Warum ist Arc hier so schnell und reicht es, um an RTX 3060 Ti und RX 6700 XT vorbeizuziehen?
In diesem Artikel
Vor wenigen Tagen gaben Intels Arc-Grafikkarten ihr offizielles Stelldichein. Im ausführlichen Intel-Arc-Test informierten wir Sie über die Stärken und Schwächen der brandneuen Xe-Architektur in der Ausprägung "High Performance Gaming" (HPG). Tatsächlich steckt viel Performance in den Arc-Modellen A770 und A750, sofern man ihnen moderne Spiele vorsetzt. Im besten Licht - technisch und bildlich gesprochen - steht Arc beim Raytracing da. Doch warum ist das so und welches Leistungsniveau ist bei der Strahlverfolgung grundsätzlich zu erwarten? Das sehen wir uns im Folgenden noch etwas genauer an, mit weiteren Spielen und etwas technischem Hintergrund.
Arc Alchemist: Strahlemann
Der ACM-G10, Intels derzeit schnellster Grafikprozessor und Motor der Arc-A7-Grafikkarten, bringt stolze 21,7 Milliarden Schaltungen auf 406 Quadratmillimeter Kernfläche unter. Damit ist er für einen Mittelklasse-Chip in moderner Node-6-Fertigung wahrlich gut genährt und Kenner fragen sich, weshalb der Chip trotz der vielen Schaltungen relativ wenig Leistung erzielt. Die Antwort darauf liegt sowohl unter der Haube als auch in der Software.
Beim Blick auf die Hardware-Innereien wird klar, dass die Intel-Ingenieure viele Transistoren für fortschrittliche Funktionen investiert haben. Zur Erinnerung: Die letzte Nvidia-Architektur mit reinem Rasterizer-Fokus hört auf den Namen Pascal und erblickte im Jahr 2016 das Licht der Welt. Seit Turing (2018) installieren die Geforce-Macher dedizierte Rechenwerke, welche so mancher Spieler bis heute für Platzverschwendung hält: Raytracing-Einheiten und zuarbeitende Rechenwerke, die Spezialaufgaben mit unglaublichem Durchsatz erledigen können ("Tensor Cores"). Nach einigen Dürrejahren hat sowohl der Raytracing-Zug als auch Hardware-gestütztes Upscaling deutlich an Fahrt aufgenommen und die Industrie ist sich einig: Das ist die Zukunft. Nachdem AMD im Jahr 2020 mit der RDNA-2-Architektur ebenfalls Raytracing-Einheiten implementiert hatte, diese aber minimalistisch ausgefallen sind und besagte Spezialkerne ebenfalls fehlen, war die Präsentation von Xe HPG im Jahr 2021 besonders interessant. Intels Grafiksparte schlägt in die gleiche Kerbe wie Nvidia, mit mächtigen Raytracing-Kernen sowie "Intel Matrix Extensions" genannten XMX-Einheiten im Stile der Tensor-Kerne. Letztere haben ihren Ursprung im professionellen Bereich, doch Machine Learning ist längst auch im Gaming-Segment mehr als ein kurzlebiger Trend. So sollen die XMX-Einheiten den chronisch überlasteten FP32-ALUs (Vector Units) mithilfe cleverer Upsampling-Verfahren unter die Arme greifen, wofür Intel XeSS im Stile von DLSS ins Leben gerufen hat.
Folgt man den Ausführungen Intels, entsprechenden Arcs Raytracing-Einheiten ungefähr den Nvidia-Gegenstücken innerhalb von Ampere - und diese sind bis zum Release der ersten Ada-Grafikkarte (Geforce RTX 4090) das Beste vom Besten. Dies beinhaltet relativ unflexible, aber rasante Rechenwerke für bestimmte Zwecke - sogenannte Fixed-Function-Units. Diese übernehmen in Turing, Ampere und ACM-G10 die Beschleunigung der Raytracing-Datenstruktur BVH (Bounding Volume Hierarchy) inklusive Intersection-Arbeiten und halten die Daten in einem dedizierten Cache vor. Damit nicht genug, Arc beinhaltet außerdem eine Zutat, die Nvidia erst ins Ada-Silizium gießt: die sogenannte Thread Sorting Unit (TSU). Eine solche steckt in jedem Xe-Core und soll den diffusen Datenstrom beim Raytracing in effizienter ausführbare Sequenzen vorsortieren. Nvidia nennt diese Funktion Shader Execution Reordering (SER) und gibt an, dass diese Einheit gezielt von Entwicklern angesprochen werden muss. Intel hingegen betont, dass dies automatisiert geschieht, was ein klarer Vorteil ist - aber vermutlich nicht ganz so effizient wie ein Zusammenspiel mit Game-Code.
| Grafikkarte | Arc A770 16GB | Arc A770 8GB | Arc A750 | Geforce RTX 3060 | Radeon RX 6650 XT |
|---|---|---|---|---|---|
| GPU-Codename | ACM-G10 | ACM-G10 | ACM-G10 | GA106-300 | Navi 23 KXT |
| Fertigungstechnologie & Foundry | N6 TSMC | N6 TSMC | N6 TSMC | 8N Samsung | N7P TSMC |
| Transistoren Grafikchip (Mio.) | 21.700 | 21.700 | 21.700 | 12.000 | 11.060 |
| Die-Size (mm²) | 406 | 406 | 406 | 276 | 237 |
| Typischer Kerntakt (MHz) | 2.100 | 2.100 | 2.050 | 1.777 | 2.410 |
| Speichertakt (MHz/GTs) | 8.750/17,5 | 8.000/16,0 | 8.000/16,0 | 7.501/15,0 | 8.750/17,5 |
| SIMDs (Xe-Cores, CUs, SMs) | 32 | 32 | 28 | 28 | 32 |
| FP32-ALUs (SP) | 4.096 | 4.096 | 3.584 | 3.584 | 2.048 |
| Raytracing-Einheiten | 32 | 32 | 28 | 28 | 32 |
| GFLOPS FP32 (SP) | 17.203 | 17.203 | 14.694 | 12.738 | 9.871 |
| Level-2-Cache (MiByte) | 16 | 16 | 16 | 2,25 | 2 |
| Level-3-Cache (MiByte) | – | – | – | – | 32 |
| Speicherinterface (Bit) | 256 | 256 | 256 | 192 | 128 |
| Speichertransferrate (GByte/s) | 560 | 512 | 512 | 360 | 280 |
| Speicherbestückung (MiByte) | 16.384 | 8.192 | 8.192 | 12.288 | 8.192 |
Angaben der Leistung jeweils mit typischem GPU-Boost laut Hersteller. In der Praxis schwankt die Frequenz (in der Regel fällt sie höher aus) und daher auch der Durchsatz.
Lange Rede, kurzer Sinn: Arc ist Hardware-seitig bestens auf Raytracing vorbereitet. Was Intels jungen Alchemisten zurückhält, ist der Treiber - selbst unter DirectX 12 und Vulkan, den aktuellen Raytracing-Schnittstellen. Denn obwohl der Treiber hier weniger Kontrolle hat als unter DirectX 11 und älter, ist sein Einfluss als Kommunikator zwischen GPU und API nicht unerheblich. Intels Grafikchef Raja Koduri erläutert diese Tatsache im neuesten Intel-Talk rund um Arc und lässt somit große Leistungssprünge erhoffen, da das Treiber-Team noch lange nicht das Potenzial der Hardware erschlossen hat. Damit leiten wir zur Praxis über: Was leisten die Arc-Grafikkarten A770 und A750 beim Raytracing?

), dann wird man bei AMD und Intel natürlich absehbar das bessere P/L-Verhältnis finden. AMD, weil sie schon seit Jahren nicht zulegen können bzgl. ihrer Absätze und Marktanteile und Intel schon einmal per se wegen ihrem Neueinsteiger/Underdog-Status.
Die nächste Frage ist natürlich der Treiber *), aber wenn man sich ansieht, dass die schon jetzt relativ große Schritte machen, kann man sich ausmalen, dass ein Mitte- oder 2HJ23-Produkt dahingehend eher keinen übermäßigen Kritikpunkt bieten wird.**)
Absehbar wird man aber auch nächstes Jahr bei AMD und nVidia die ausgereiftere Technik bekommen, d. h. Intel wird auch wie AMD seit Jahren primär über P/L arbeiten müssen, was aber bei einem Markteintritt eine grundsätzliche Strategie ist.
Zu deiner Suche, hier wirst du nächstes Jahr wohl die Auswahl haben zwischen einer tatsächlichen 3080 oder 6800(XT), weil günstig im Abverkauf oder entsprechenden kleineren aber mindestens gleich schnellen Produkten aus der neuen Generation.
Zum "Saufen von Ada": Das ist ein Trugschluss, die Architektur in Verbindung mit dem 4N-Prozess ist extrem effizient und nach dem was nun vorgelegt wurde dürfte AMD mit RDNA3 da Watt/Frame-technisch bestenfalls rankommen aber wahrscheinlich nVidia nicht übertreffen können, zumal auch noch die RTX 4090 extrem hohes Undervolting-Potential zeigt. Ada ist tatsächlich extrem effizient. Entsprechend kannst du dir an zwei Fingern ausrechnen, dass man natürlich später auch kleinere Modelle mit entsprechender Effizienz kaufen können wird. Wie nVidia @Stock auslegt ist eine andere Frage, möglicherweise muss man tunen, aber dass Ada "viel säuft" ist grundsätzlich falsch, da wie gesagt das die mit sehr deutlichem Abstand effizientes GPU-Design am Markt. -- Der Preis ist wieder ein anderes Thema, denn das ist bei nVidia ein grundsätzliches Thema, da AMD zwar konkurrieren aber sie offensichtlich nicht übermäßig unter Druck setzen kann, sodass sie sich bei der Preisgestaltung noch nicht auf nennenswerte Kompromisse einlassen müssen.
Darüber hinaus, wenn Kosten eine nennenswerte Rolle spielen (bei wem nicht?
Ein mögliches Differenzierungskriterium dürfte mit Blick auf aktuelle und kommende Titel natürlich auch die Frage sein, wie man für sich persönlich Raytracing bewertet (also noch höhere grafische Qualität). Ada ist da offensichtlich sehr stark, bei RDNA3 und Battlemage weiß man noch nicht was kommt.***)
*) Interessanterweise scheint die Treiberproblematik zumindest teilweise nicht unmittelbar an Intel zu liegen, wenn man den Recherchen von SemiAccurate glauben darf. Intel entwickelt Treiberkomponenten verteilt über den ganzen Globus, jedoch wurden Schlüsselkomponten für den Shader Compiler und weitere performancerelevante Teile von einem Team in Russland entwickelt. Als Russland Ende Februar in die Ukraine einfiel und schnell straffe Sanktionen etabliert wurden war es nahezu unmöglich noch produktiv mit dem Team weiterzuarbeiten. Den vollen Artikel kann man hier nachlesen:
[Ins Forum, um diesen Inhalt zu sehen]
**) Zumindest bei halbwegs aktuellen bzw. zumindest aktuelleren Titeln. Gräbt man dagegen bspw. einen 2010er Titel aus könnte man durchaus des Öfteren auf Probleme stoßen, denn Intel hat natürlich keine Zeit und kein Geld die letzten 10 oder 20 Jahre GPU/Spiele-Geschichte (vollständig) treibertechnisch aufzuarbeiten (zumal Kunden nicht bereit sind das zu bezahlen), denn typischerweise sind das Inkompatibilitäten der Softwareentwickler, die Intels Treiberentwickler hier abfangen und ausbügeln müssen und das pro Titel.
***) Zum Vergleich zwei, drei Zaheln von Igor, wenn die GPU hochgradig ausgelastet wird, also 4K, Ultra Settings mit RT in Cyberpunk 2077 @Stock: Die RX 6950XT (verm. ein gepimptes Custom-Design) benötigt 431 W für 13,5 Fps, die RTX 3090 Ti 434 W für 24,7 Fps und die RTX 4090 422 W für 41,9 Fps. Bezüglich der Effizienz sind das 31,9 ; 17,6 ; 10,1 Watt/Frame, also ein drastischer Effizienzanstieg ggü. Ampere (noch ohne Berücksichtigun des guten Undervolting-Potentials). Das schlechte Abschneiden der Navi-Karte rührt daher, dass AMD die 6950XT noch einmal etwas "überzogen" hat und ist zudem durch die Raytracing-Schwäche zu erklären, so insbesondere auch in diesem Titel. Die reguläre 6900XT schneidet mit 25,0 W/F bereits deutlich besser ab und in einem weiter auf RDNA optimierten Titel werden die AMD-Karten grundsätzlich noch etwas besser abschneiden können, kommen aber nicht an die effizientere RT-Implementation von nVidia-Karten heran. Was RDNA3 diesbezüglich besser machen wird, wird man in ein, zwei Monaten sehen.
Da ich mich an Igors Arbeit "bedient" habe, hier auch der Link zur eigenen Recherche:
[Ins Forum, um diesen Inhalt zu sehen]
****) Randbemerkung zum VRAM, bei Igor in Cyberpunk recht schön zu sehen: Hier bricht die 3080 10 GB deutlich ein, was voraussichtlich am zu knappen VRAM bei diesen Settings (4K, Ultra & RT) liegt. Die gemittelten Fps liegen zu weit von der Ti weg und die P1-Low-Fps brechen drastisch ein. Die 12 GB der Ti zeigen dagegen ein normales/erwartbares Verhalten, d. h. mit etwas wie gar 16 GB wird man auch mit deutlichem Puffer zukunftssicher aufgestellt sein, einen Ausbau den man bei AMD und Intel gar in einem unteren Segment angeboten bekommen wird (aus kompetetiven Gründen).
Da in dem Fall eine PCIe x16 Karte verbaut ist, stellt sich das Problem nicht.
Das eigentliche Problem ist, dass die Anschüsse Herstellerspezifisch sind. Wenn es statt einem 24Pin ATX nur einen 8 Pin 12VO Anschluss gibt, dann schaut man blöd und muß basteln, wenn man ein neues Netzteil möchte. Aber der ATX 12VO Standard sollte da hoffentlich Abhilfe schaffen.
Ähm nein.
Größtes Aufrüsthindernis ist ein fehlender PCIe x16 Slot, der ist aber zwangsweise vorhanden. Das Netzteil muß auch ausreichend dimensioniert sein, um die Intelkarte zu versorgen. Es ist ja nicht so, dass das Ding nur 30W benötigt und keine PCIe Stromanschlüsse hat.
Von daher läßt sich so ein Ding akzeptabel aufrüsten.
Vermutlich kaufst du jetzt nicht oft Fertig-PCs, aber ich hatte bereits einige in den Händen.
Da sind gerne mal fest verschweisste Teile dabei, MBs die exakt die Schnittstellen bieten die belegt sind und keine einzige mehr, Netzteile hart auf Kante genäht etc.
Lüfterkonstruktionen sind manchmal so angebracht, dass man sie nicht wieder einbauen kann wenn man sie einmal entfernt hat.
Allerdings sollte ich einschränken: Meine Erfahrungen sind da etwas älter, seit ca. 5 Jahren hatte ich dann doch keinen OEM-PC mehr hier.
MfG
Raff