RDNA 3: Leistung pro Watt und Infinity Cache sind wichtig
Die neuen Radeons auf Basis von RDNA 2 (RX 6800 / RX 6900) sind noch nicht einmal da, schon spricht AMD im Interview über den Architekturnachfolger RDNA 3. Die Ziele sind klar: Die Leistung pro Watt soll erneut massiv gesteigert werden und auch der Infinity Cache spielt eine wichtige Rolle.
Die RDNA-2-Desktop-Generation startet ab dem 18.11. mit Radeon RX 6800 (XT) - aber der Blick geht bei AMD auch schon in die Richtung des Nachfolgers RDNA 3 (vermutlich Radeon RX 7000). Entsprechende GPUs sollen laut offizieller Roadmap im verbesserten 7-Nanometer-Prozess ("Advanced Node") bis spätestens 2022 erscheinen.
Radeon RX "7000": Designziele für RDNA 3
In einem Interview gab Rick Bergman, Executive Vice President Computing and Graphics bei AMD, nicht nur Einblicke in einen Zen 3 Refresh bzw. Zen 4, sondern beantwortete auch Fragen zum Navi-2x-Nachfolger RDNA 3. Im Gespräch mit The Street erläutert Bergman, dass man für RDNA 2 die Leistung pro Watt "ziemlich aggressiv" ins Visier genommen habe - und das gelte analog auch für RDNA 3. Eine zu hohe Leistungsaufnahme - und hier kann sich Bergman einen Seitenhieb auf Nvidia nicht verkneifen - sorge dafür, dass stärkere Netzteile und fortschrittlichere Kühllösungen notwendig werden. Das treibe die Kosten der Platine nach oben. Das könne man nur durch einen höheren Verkaufspreis auffangen oder durch niedrigere Kosten bei der GPU.
Und das sei nur der Blickwinkel auf der Desktopseite. Auf der Notebookseite sei es noch offensichtlicher, wie wichtig die Leistung pro Watt wäre. Durch den begrenzten Platz könne man durch eine gestiegene Effizienz mehr Leistung erzielen, ohne "exotische Kühllösungen" einzusetzen. Daher habe man sich bei RDNA 2 so stark auf das Thema Effizienz konzentriert und auch bei RDNA 3 stehe das im Vordergrund. Ob AMD bei RNDA 3 auch Verbesserungen im Bereich 50 Prozent und mehr bei Performance pro Watt anstrebt, wie das einige Webseiten mutmaßen, lässt sich aus dem Interview tatsächlich nicht herauslesen.
Dagegen ist sicher, dass der bei RDNA 2 eingeführte Infinity Cache auch bei RDNA 3 eine wichtige Rolle spielen wird. Die RDNA-2-Chips verfügen bekanntlich über eine veränderte Cache-Hierarchie und bringen einen 128 MiByte großen "Infinity Cache" mit, welcher direkt im Kern platziert wird. Damit werden gleich zwei Themen adressiert: Die Abhängigkeit zum klassischen Grafikspeicher nimmt ab und die Effizienz steigt. Gerade Letzteres betont Bergman im Interview: Erhöht man "klassisch" die Taktraten von Speicher oder verbreitet den Speicherbus, steigt der Stromverbrauch. Durch den Infinity Cache, den AMD als Äquivalent zum L3-Cache in CPUs ansieht, kann man nicht nur die Leistungsaufnahme senken, sondern auch Kosten sparen und die Leistung steigern. Bergman deutet an, dass bei RDNA 3 das Thema Infinity Cache "mit Sicherheit auf dem Tisch" liege. Laut aktueller Roadmap befinden sich RDNA-3-GPUs noch in der Designphase.

3: Du weißt, wie es gemeint ist, stell dich nicht absichtlich dumm.
4: Nichts davon kann ihnen jetzt noch helfen. Das gleiche kann man auch über Intel sagen, deren Probleme ließen sich auch nicht mit Geld zukleistern. Wenn Nvidia nicht vor 4-5 Jahren etwas in Auftrag gegeben hat, dann kommt da auch ersteinmal nichts.
3) ich stelle mich nicht dumm. Nvidia produziert in Samsungs 8nm Prozess, weil er vermutlich günstiger ist als TSMC. Man hat hat sich wohl verschätzt was die Produktion betrifft, oder was AMD betrifft. Zu glauben, AMD sei ab jetzt überlegen entbehrt jeglicher Grundlage. Bis morgen ist Nvidia absoluter Performanceführer, ab morgen sind die beiden gleich auf, aber Nvidia wird Marktführer bleiben bei den dedizierten Karten.
Man wird 2021 nur ein kleines Refresh nachlegen, weiter in 8nm.
Und 2022 in 5nm produzieren. Wenig später wird man mit Samsung GAAT Chips in "3nm" produzieren können, wenn gewünscht. Der soll parallel zu TSMCs 3nm laufen, welcher noch mit traditionellen Mitteln gefertigt wird.
4) na Klar hilft Geld enorm. Bessere Entwicklungen, bessere Treiber, besserer Support der Entwickler, besseres Marketing, mehr Features und dank Geld lassen sich auch viele Zwischenschritte in der Produktion besser beforschen. Oder ZSMC Mehr boeten für Produktionskapazitäten.
Der Vergleich mit Intel hinkt: Nvidia wird beim Prozess keine 5 Jahre stehen bleiben. Außerdem hat Intel seit Zen 1 Release Rekordumsatz nach Rekordunsatt gehebt und der Marktführer ist man immer noch deutlich. Wird man auch noch bleiben, trotz überlegenem Ryzen.
Ich verstehe den Wunsch das "arrogante" Nvidia vom Thron Zu stoßen, David möge gefen Goliath gewinnen, aber so einfach ist das nicht. Nvidia hat sich außer der Liefermenge keinen Patzer geleistet. Die geringen RAM Mengen stören nur uns Enthusiasten. Sie führen höchstens dazu, dass die Karten schneller altern, aber ein zufriedener Nvidia User wird wohl wieder Nvidia nehmen. Das steigert den Gewinn gleich 2x: beim Verkauf kostet das RAM ja weniger und User kaufen früher wieder. Und ein Refresh Mot nur wenig Mehrleistung -wie er nächstes Jahr kommen wird- hätte ein gutes Zusatzargument
Darüber hinaus, sieht man sich die bevorstehenden Entwicklungen bei AMD und nVidia an, wird AMD selbst mit dem Jahresabschluss 2022 nicht an nVidia heranreichen können und beim Gewinn wird ihr Rückstand gar noch deutlich größer ausfallen. Wie auch Intel hat nVidia grundsätzlich deutlich mehr Reserven, die bei Bedarf natürlich auch eingebracht werden können.
[Ins Forum, um diesen Inhalt zu sehen]: Ich schrieb auch von einem "sportlichen Ziel", nicht von einem unmöglichen. Faktisch wird es definitiv kein leichtes Unterfangen werden, denn AMDs aktuelle Entwicklung bewegte sich bereits nur im erwartbaren Rahmen und nicht nennenswert darüber hinaus und auch hier drüfte die Fertigung für AMD bereits eine gewichtige Rolle spielen, denn offensichtlich benötigt man den sehr hohen Takt um mit nVidia's überarbeiteter Architektur mithalten zu können.
Und darüber hinaus ist ihre Aussage für sich alleine genommen ja auch immer noch relativ wertlos und nicht mehr als eine Werbeaussage, da sie erst mit Blick auf das was die Konkurrenz machen wird an Bedeutung gewinnt und hier werden sich weder nVidia noch Intel auf die faule Haut legen und AMD einfach mal machen lassen. Hier wird man abwarten müssen.
Aktuell hat man aus der Konsumentenbrille heraus zumindest wieder eine sehr erfreuliche Konstellation vorliegen, auch wenn derzeit voraussichtlich keiner von beiden sich nennenswert absetzen oder aber liefern kann.
3: Du weißt, wie es gemeint ist, stell dich nicht absichtlich dumm.
4: Nichts davon kann ihnen jetzt noch helfen. Das gleiche kann man auch über Intel sagen, deren Probleme ließen sich auch nicht mit Geld zukleistern. Wenn Nvidia nicht vor 4-5 Jahren etwas in Auftrag gegeben hat, dann kommt da auch ersteinmal nichts.
2: Verbessert sich die Qualität der Chips im laufe der Zeit etwas, Welten sind da aber meist nicht drin.
3: Ein Wechsel, zurück zu TSMC, dauert wohl einfach viel zu lang und die Kapazitäten sind da wohl ausgebucht. Wenn sie da nicht schon im vornherein eine GPU in Auftrag gegeben haben, dann sehe ich wenig Chancen bis zur nächsten Generation.
4: Wenn AMD jetzt wieder jährlich neue GPUs herausbringt, dann kann Nvidia erst einmal keine angemessene Antwort bringen, außer eventuell einen Refresh. Eine GPU zu entwickeln dauert 4-5 Jahre. Sprich: wenn Nvidia sofort damit beginnen würde, dann könnten sie theoretisch noch 2025 eine Zwischen-GPU rausbringen, vermutlich allerdings erst 2027.
Wenn der Abstand von RDNA 2 zu Ampere wirklich so klein ist, und AMD schon Ende nächsten Jahres RDNA 3 rausbringt, dann würden wohl 15-20% mehr als nur reichen, um sich die Gamingkrone aufzusetzen, zumindest für ein Jahr
3. Nvidia muss nicht wechseln, man produziert bei beiden Herstellern. Wenn es geplant ist, wird man auf 5nm schwenken.
4. Nichts hindert Nvidia daran AMDs Tempo mitzugehen. Man hat mehr Hardwareentwickler im GPU Team, mehr Softwareentwickler, bessere Kontakte zu Enwicklern, mehr Geld.
TSMC gibt für 7FF ggü. ihrem eigenen 10FF bereits bis zu 40 % Power Savings an (bei Iso-Performance; i. V. z. 16FF+ gar bis zu 60 %). Turing verwendet jedoch nicht einmal 10 nm, sondern gerade mal den 12FFC (in Form des minimal angpassten 12FFN), d. h. einen 16nm-Prozess der vierten Generation. Weiterhin hinzu kommt, dass Navi 10 nicht nur 7FF, sondern gar den 7FFP nutzt, der im best case i. V. z. 7FF noch einmal bis zu weitere 10 % Power Savings hätte ermöglichen können (gemäß TSMC). Navi 10 ist also tatsächlich ein vergleichsweise ineffizientes Design.
Entsprechend wenig überraschend sind nun auch die abgelieferten Zugewinne seitens AMD mit RDNA2.
Und Raytracing hat nichts mit diesem Vergleich zu tun, da die hier herangezogenen Verbrauchswerte auf normale Rasterizer-Messungen zurückzuführen sind. Darüber hinaus verkennst du auch AMDs Raytracing-Implementation. Wie auch nVidia verwendet AMD hier dedizierte Funktionseinheiten zur Raytracing-Berechnung, etwas wie "in die normalen Kerne quasi integrierten RT Fähigkeiten" gibt es hier ebensowenig. AMD hat das ganze lediglich etwas anders implementiert, im einfachsten Fall gar nur zwangsweise aus patentrechlichen Gründen, aber auch sie verwenden von den SPs losgelöste dedizierte Hardware. Darüber hinaus haben auch hier die von AMD bisher vorläufig präsentierten (Verbrauchs)Werte eher nichts mit Raytracing zu tun, da AMD bisher über das Thema eher wenig gesagt hat, vermutlich da man hier nicht ganz mit nVidia mithalten kann.
Bezüglich der Power Savings des Prozesses sind sicherlich leichte Unterschiede zu 7FF(P) anzunehmen, aber eben keine übermäßig hohen, was auch erneut das bestätigt, was hinten rauszukommen scheint gemäß erster AMD-Leistungswerte. Die GPU-Chips selbst scheinen für eine vergleichbare Leistung zumindest grob erneut in etwa das gleiche zu "verheizen" in Form thermischer Abwärme.
Bezüglich dem OC-GGDR6 (einen offiziellen GDDR6X-Standard gibt es noch nicht, die Chips sind bisher ein proprietäres Design von Micron und zurzeit ist unklar, ob die JEDEC diese Spezifikation überhaupt zum Standard erheben wird) vertust du dich. Die Micron-Chips "verheizen" deutlich mehr als reguläres GDDR6, was auch zu der deutlich höheren TBP der Ampere-Boards führt und bspw. auch ein hauptsächlicher Grund ist, warum man bei der RTX 3090 noch einmal weitere +30 W auf die offizielle TBP-Angabe draufschlagen musste i. V. z. RTX 3080.
Die RDNA2-Karten kommen hier besser weg (nicht so gigantisch, wie mansche Spezialisten in den letzten Wochen postulierten, teilw. mit bis zu völlig unsinigen -100 W, etc.), da sie gerade mal acht 16 Gb-Chips anbinden. (Neben dem reinen Verbrauch der Micron-Chips und des höher taktenden (und in größerer Zahl vorliegenden) PHYs sind ja zusätzlich obendrauf noch die Wandlerverluste aufzuschlagen, bspw. eine 300 W-TBP-Karte hat ja bereits bis zu 50 W Verluste).
*) Angemerkt sei, dass ein derart vereinfacher Vergleich der Logikdichte gegen BigNavi/RDNA2 voraussichtlich zu einem Apfel-mit-Birnen-Vergleich führt aufgrund des überproportional großen InfinityCaches der mit seinen über 100 mm2 einen wesentlichen Einfluss nehmen wird.