Die Entwicklung der Grafikkarten-Technologie

PCGH Rückblick: Entwicklung der 3D-Grafikkarten (Teil 5)

Der PC Games Hardware-Rückblick zeichnet die Entwicklung der Grafikkarten seit dem Durchbruch der Voodoo Graphics von 3Dfx im Jahre 1996 bis heute nach. Wie kam es zum Untergang der 3D-Pioniere und wie wogte der Wettstreit zwischen Ati und Nvidia mal in die eine, mal in die andere Richtung - all dies klärt unsere Rückblicks-Reihe. (Carsten Spille, 02.11.2008)
 
PCGH Rückblick: Entwicklung der 3D-Grafikkarten (Teil 5)
 
[Quelle: siehe Bildergalerie]



In den ersten vier Teilen (Links siehe unten) haben wir nachvollzogen, wie es zum Siegeszug der 3D-Beschleunigung, angeführt von Massenmarkt-Pionier 3Dfx (später mit kleinem "d") gekommen ist. Auch die Bereinigung des Marktes beziehungsweise das Abdriften von ehemals bedeutsamen Herstellern wie S3 und Matrox in Nischenmärkte haben wir thematisiert.


PCGH Rückblick: Entwicklung der 3D-Grafikkarten (Teil 1)
PCGH Rückblick: Entwicklung der 3D-Grafikkarten (Teil 2)
PCGH Rückblick: Entwicklung der 3D-Grafikkarten (Teil 3)
PCGH Rückblick: Entwicklung der 3D-Grafikkarten (Teil 4)

Rückblick: Duopol Ati/Nvidia
Ende 2000 erwischte es leider auch den ehemaligen Marktführer 3dfx (nun mit kleinem "d"): Dank Missmanagement wie dem Zukauf der ehemaligen STB-Fabrik, um die Voodoo-3-Reihe exklusiv vermarkten zu können, zu langem Ausruhen auf ehemals guter Technologie und Problemen bei der Entwicklung und Produktion des konkurrenzfähigen VSA-100-Chips reihte sich ein rotes Quartal ans nächste, und schließlich konnten sich der ehemalige Mitbewerber Nvidia für kleines Geld an der Konkursmasse gütlich tun.

Seit diesem Zeitpunkt beherrschten also Ati, die heutige Grafiksparte von AMD, und Nvidia den Markt - auch ein kurzes Strohfeuer der interessanten Power-VR-Technologie in Form von Kyro und Kyro II (beide mit Tile-Based-Deferred-Rendering) änderte daran nichts.

Nvidia war spätestens seit Einführung der Geforce im Jahre 1999 unumstrittener Marktührer und konnte dies durch geschicktes Marketing und kleine Häppchen an Technologie-Fortschritt in steigende Aktienkurse umsetzen, ohne an Fahrt zu verlieren. Ati, welche die Anfangstage der 3D-Beschleunigung komplett verschlafen hatte und deren Hardware nicht zuletzt an damals noch schlechten Treibern laborierte, konnte sich nur dank exzellenter, langfristiger Kontakte und Geschäfte im OEM-Bereich gegen die 3D-Retailkarten behaupten. In fast jedem Media-Markt-PC der späten 1990er-Jahre steckte eine Rage 3D - mit Zusätzen wie "II", Pro und Turbo künstlich aktuell gehalten. Erst die Rage-128-Reihe konnte durch Feature-Set und Technik zumindest in Sachen 32-Bit-Rendering, welches deutlich effizienter arbeitete als bei Nvidias Riva-TNT-Reihe, wieder mithalten.

Doch erst im Jahre 2000 stieg man mit den ersten Karten der Radeon-Generation wieder voll in den Gamermarkt ein. Radeon 256 samt Nachfolger/Ableger 7500 konnte sich Dank des Effizienzpaketes "Hyper-Z" zwar beim 32-Bit-Rendering erneut gut gegen die jeweiligen Geforce-Karten behaupten, die Treiber und (in den Benchmarksparcours der Zeit) immer noch wichtige 16-Bit-Rendering machten immer noch einen Strich durch das gute Gesamtpaket.

So änderte dann auch die Radeon 8500 nichts an der Nvidia-Dominanz, obwohl sie einige interessante Techniken, wie zum Beispiel Truform (N-Patch-basierte higher-order-surfaces, Freiformflächen), Unterstützung für Pixelshader 1.4, weiter verbessertes Hyper-Z und einen extrem schnellen aber aus heutiger Sicht extrem schlechten anisotropen Texurfilter aufbieten konnte und die Geforce 3 mit ihrem langsamen aber guten AF in einigen Benchmarks auch durchaus schlagen konnte. Letztere punktete dafür mit effizientem 2x Multisampling, während die eigentlich ebenfalls für Multisampling designte R200 aufgrund eines Fehler nur unter sehr speziellen und seltenen Umständen Multisampling nutzen konnte und ansonsten auf ein langsames Ordered-Grid-Supersampling zurückgreifen musste.

Nvidia schob kurze Zeit später die höher getaktete Geforce 3 TI 500 nach und im Frühjahr 2002 die Geforce 4, welche mit bis zu 325 MHz nochmals höher taktete und auch sonst eine leicht verbesserte NV20-Architektur aufwies.

Im September 2002 schlug Ati jedoch mit einem Paukenschlag zurück. Der R300, als GPU auf Grafikkarten der Radeon-9700- und 9500-Reihe eingesetzt, machte kurzen Prozess mit Geforce 4 und dem rundum verkorksten Nachfolger, der Geforce FX. In der Folgezeit konnte Ati mit Radeon 9700 Pro, dem Preisleistungs-Knaller 9500 Pro, der ebenfalls legendären 9800-Reihe und hernach der X800 Marktanteile und Sympathien gewinnen.

Nvidia konterte erst 2004 mit der Geforce 6 wieder erfolgreich, nachdem der 256-Bit- und FP16-Refresh FX5900 samt mildem Speed-Grade FX5950 keine Chance gegen die Radeons hatten. Die Geforce 6 bot nicht nur (endlich sinnvoll) nutzbare 2.0-Shader-Einheiten, auch die höchste DX9-Ausbaustufe, Shader-Model 3.0 wurde unterstützt. Ati konnte hier technologisch nicht mithalten, sparte aber dafür eine Menge Transistoren und konnte die eigenen GPUs entsprechend deutlich höher Takten, als es Nvidia mit der Geforce 6 gelang. Entsprechend lagen die Radeon-Karten in Sachen Spieleleistung weiterhin meist in Front, Nvidia war nunmehr aber ein ernster Konkurrent, kein Opfer mehr.

Einige Refreshes und Ausbaustufen später standen sich Mitte 2005 die Radeon X850 XTPE und die Geforce 7800 GTX gegenüber - letzte eine deutlich aufgebohrte GF6-Architektur mit 50 % mehr Pixel-Pipelines und mehr als der doppelten Rechenleistung als der Urahn. Ati hingegen hatte mit dem abgesagten, offenbar zu ambitionierten R400-Projekt und der Zwischenlösung X800-, aka R420-481-Reihe nur weitere Taktsteigerungen zu bieten und lag - wenig verwunderlich - zu diesem Zeitpunkt deutlich hinten. Das R520-Projekt hatte sich um ein halbes Jahr verspätet.

[index]


Die X1000-Reihe
Im Oktober 2005 war es nach der angesprochenen, sechsmonatigen Verzögerung endlich so weit: Mit der - aufgrund der Verspätung - auf einen Schlag vorgestelltenX1000-Familie. Alle Karten, also die X1300 (Low-Cost), X1600 (Mainstream) und X1800 (High-End) verfügten über komplette Shader-Model-3-Unterstützung (nach der Ati-Auslegung der Spezifikation, Nvidia sah das aufgrund fehlenden Vertex-Texture-Fetches etwas anders...) und, was für Spieler bedeutsamer war, konnten HDR-Rendering mit Multisampling-FSAA kombinieren. Nvidia konnte das bis zur Geforce 8 nicht.

Außerdem trat die X1000-Familie im brandneuen 90-Nanometer-Prozess an, welches trotz sehr komplexer Designs - erstmals seit dem R200 (Radeon 8500) waren die Ati-GPUs komplexer als ihre technologischen Nvidia-Gegenstücke - hohe Taktraten erlaubte. Diese Kombination führte allerdings auch zu großem Leistungshunger und entsprechend geräuschvoller Kühlung.

In Sachen Fps war die Radeon wieder an die Geforce heran und in sehr shaderlastigen und speicherfressenden Spielen überholte sie die Geforce auch des öfteren.Aber auch in Sachen Bildqualität hatten die Kanadier zugelegt. Neben ihrem seit der Radeon 9700 Pro schon ungeschlagenem 6x MSAA verbesserten Sie auch den anisotropen Texturfilter. Die Qualität des Letzteren war seit aus Performance-Gründen bei Nvidia stetig verschlechtert worden und hatte sich unterhalb dessen eingependelt, welches Ati seit dem R300 eingeführt hatte. Mit dem R520 bzw. der SM3-fähigen X1000-Reihe wurde die Qualität nun zumindest optional wieder auf ein Niveau angehoben, welches High-End-GPUs dieser Zeit würdig war.

Nvidia schob im November eine Kleinserie der 7800 GTX mit 512 MiByte VRAM und stark erhöhten Taktraten ein - Verzweiflungstat sagen manche, Machtdemonstration sagen andere. Durch die hohen Takrtaten konnten die (wenigen verfügbaren) 7800 GTX/512 jedenfalls die X1800 in den meisten zeitgenössischen Benchmarks wieder hinter sich lassen. Doch all das half wenig, denn trotz Verspätung des R520 war dessen Refresh, der R580, genau im Zeitplan und mit starken Verbesserungen bei geringen Transistorkosten bereits im Januar/Februar 2006 verfügbar. Neben minimal höheren Taktraten bei der GPU bot das Grafikrechenzentrum der X1900XT(X)-Reihe nun dreimal soviele Shader-ALUs wie die R520 und konnte die Geforce abermals deutlich in die Schranken weisen.




Mittelkasse: Zu früh, zu wenig
Das galt allerdings weniger für die Mittelklasse: Zwar fußte die X1600 auf derselben, fortschrittlichen Architektur wie die X1800, bot aber nur sehr wenige Ausführungseinheiten auf. Zwar verfügte der RV530-Chip über immerhin 12 MADD-fähige Shader-ALUs und (ebenfalls: immerhin!) entkoppelte Textureinheiten - derer aber nur vier. Damit hatte die Karte trotz modernerer Architektur einen schweren Stand gegen die 6600 GT, sofern diese ebenfalls mit 256 MiByte ausgestattet war. Die 6600 GT verfügte aber erstens mit nur 90 MHz über eine wesentlich geringere Taktdifferenz zur X1600 XT als bei den Topmodellen (X1800 XT vs 7800 GTX/256: Delta 195 MHz) und außerdem über doppelt soviel Textureinheiten, nämlich acht. ein großes Problem für Ati zu der Zeit: Der angesprochene Refresh, die X1900, war bis in den Herbst 2006 nur im High-End-Bereich verfügbar und zur Cebit enthüllte Nividia die Geforce-7-Reihe im frischen Produktionsprozess in 90 Nanometern.


[index]



Geforce 7,5
Anstelle neue Funktionen hinzuzufügen, konzentrierte man sich beim "Zwischenschieber" - dieser war nämlich nur Plan "B" anstelle der eigentlich für diesen Zeitraum geplanten DX10-Architektur des G80 - aber auf eine hohe Packdichte der Transistoren und damit eine Steigerung der Produktionsmargen. Anstatt des Fps-Performance-Vergleichs bot Nvidia Ati damit einen Preiskampf, den man dank Spar-Chips mit nur knapp 210mm² Fläche des G71 gegenüber Atis R580-Monster mit rund 360mm² noch mit guten Margen führen konnte. Im umsatzträchtigen Mittelklasse-Bereich ersetzte man die 6600 gegen die 7600 GT, welche über nochmals vier zusätzliche Pixel- und Texturpipelines zusätzlich zu den Verbesserungen bei der MADD-Leistung, verfügte und Atis X1600 hatte nun endgültig keinen Stich mehr.


Das High-End versuchte Nvidia trotz Konzentration auf die Margen mit einer Verzweiflungstat zu befriedigen: SLI auf einer Karte. Mit der Geforce 7900 GX2, welche schnell durch die 7950 GX2 ersetzt wurde, montierte man zwei der sparsamen G71-Chips auf einer Sandwichkarte: Zwei getrennte Boards, welche aufeinandergeschraubt wurden und nur einen PCI-Express-Steckplatz besetzten. Zwar konnte man damit in einigen Spielen und besonders im aktuellen 3DMark die Performance-Krone zurückerobern, aber ein sonderlicher Erfolg war diese Konstrukt dennoch nicht.

GDDR4 und "Neue Mitte": RV570
Im September (erkenne Sie eine gewisse Regelmäßigkeit?) stellte Ati - nun kurz vor der Übernahme durch AMD stehend - ein kleines Speed-Grade im High-End vor: Die X1950 XTX. Mit GDDR4-RAM ausgestattet, verbesserte Ati die X19x0-Reihe an einer Stelle, wo es ihr am wenigsten mangelte: bei der Speicherbandbreite. Allerdings fand auch ein neuer Kühler Verwendung, welcher im 2D-Modus zwar sehr leise arbeitete, aber immer wieder kurz aufheulte - auch ohne Belastung. Kurze Zeit später waren endlich die für Ati viel wichtigeren RV570-Chips bereit. Dank zusammengestrichener Hardware auf nur noch drei statt vier Pixel-Prozessoren (zwölf Pipelines+TMUs) und 80-Nanometer-Prozess war der Chip mit nur noch rund 240mm² deutlich günstiger zu fertigen und konnte sich auf der X1950 Pro im Mittelklasse-Bereich die verdiente Empfehlung des Preisleistungstipps holen. Die Geforce 7900 konnte meist nicht mithalten, zudem erschienen mehr und mehr Spiele, welche von der Xbox-360 portiert worden und somit auf die Stärken der Ati-Chips mit ihren nebenläufigen TMUs zugeschnitten waren. Endlich machte sich die Transistor-Investition in diese Technologie (Threading-Konzept) bezahlt und in den entsprechenden Spielen musste Nvidia die Quittung für ihre sparsam implementierte Quad-Batch-Architektur abholen.




[index]



Der erste Direct X 10-Chip: G80
Mitten hinein in Atis neugewonnenen Optimismus - anfänglich auch durch die Übernahme durch Prozessorhersteller AMD bedingt - setzt Nvidia im November 2006 die Markteinführung der Geforce 8800 GTX und GTS. Wie bereits erwähnt war der G80 - so der Codename des zugrunde liegenden Chips - bereits für einige Monate früher geplant und so schürte man die Gerüchteküche mit mehrdeutig (und entsprechend meist falsch interpretierten) Aussagen zur kommenden Architektur.

Zwischenspiel: Direct X 10 und dessen Implikationen
Direct X 10, und dessen Unterstützung galt als gesetzt, erfordert ein "unified shader"-Modell. Zumindest aus Sicht der API darf es keinen Unterschied mehr geben, welche Recheneinheiten angesteuert würden - inwieweit das auch für die Hardware gelten sollte, war umstritten. Theoretisch denkbar wäre auch ein Modell gewesen, welches eine klassische Direct-X-9-3D-Pipeline nutzt und nur wenige, spezielle Einheiten für Direct X 10 bereithielte, zum Beispiel einen klassischen, vielfach parallelen Pixelteil mit entsprechenden DX10-Änderungen und einige wenige DX10-Einheiten, beispielsweise für Vertex- und die neuen Geometry-Shader.

Bekannte und berüchtigte Gerüchteküchen im Internet wollten dann auch entsprechend früh vernommen haben, Nvidias G80 sei ein Pseudo-DX10-Chip. Vermutlich wurde man einerseits von Gerüchten, Nvidia hielte Spieleprogrammierer dazu an, Geometry-Shader möglichst sparsam zu verwenden und sie eher als Tech-Preview zu betrachten und andererseits durch ausweichende Aussagen von Nvidias Chefentwickler David Kirk, man werde eine Unified-Shader-Architektur bringen, wenn die Zeit reif dafür sei, auf die falsche Fährt gelockt.

G80
Beim G80 handelt es sich nicht nur um den ersten Direct-X-10-Chip, zudem verfügt er über voll vereinheitliche Shader-Einheiten. Doch nicht nur dass: Nvidia verabschiedete sich mit der G80-Architektur von den Geforce-7-Wurzeln und auch vom klassischen Ansatz der Vektor-GPUs, welche bis dato mit wechselnder Flexibilität zwei bis vier (im Vertexshader auch fünf) "Kanäle" eines RGBA-Pixels bearbeiteten und dabei zwangsläufig zu einem gewissen, störenden Prozentsatz leerliefen, wenn keine Instruktionen gefunden werden konnten, die in die Lücken geschoben werden konnten.

Der G80 kippte nun das Blockschaltbild quasi um 90 Grad und Nvidia nutzte das, um die Anzahl der Shader-Einheiten marketingwirksam auf 128 (8*16) anzuheben. Jede der acht Prozessoren bearbeitete für jeweils 16 Datensätze wie Pixel oder Vertizes einen Kanal pro Takt. Entsprechend gering war der Verschnitt: Benötigten die Daten nur einen einzelnen Kanal (Skalar), war der Prozessor nach einem Takt fertig (vereinfacht gesagt). Benötigte man drei Operationen, dauerte es eben drei Takte, bis die sechzehn Pixel fertig waren. Das gilt jedenfalls für die verbreiteten MADD-Operationen und wenn genügen Datensätze vorhanden waren, um alle 16 Kanäle des SIMD-Prozessors auszulasten.

Dazu führte nun auch Nvidia nebenläufige Textureinheiten ein, die die Arbeit der Shader-ALUs nicht mehr behinderten. Insgesamt konnte der Chip 32 Texturen pro Takt adressieren, aber bis zu 64 filtern. Dies führte endlich dazu, dass die Qualität des anisotropen Filters nicht mehr durch fragwürdige Optimierungen auf ein unwürdiges Niveau gesenkt werden musste, um die Fps-Rate hoch zu halten.

Außerdem setzte man auf ein breites 384-Bit-Speicherinterface, um den riesigen G80-Chip, welcher trotz rekordverdächtiger 681 Millionen Transistoren noch im 90-Nanometer-Prozess gefertigt wurde, mit Daten zu versorgen. Trotzdem ließ es sich dank durchdachter Kühlkonstruktion mit großem Radiallüfter und guter Lüftersteuerung noch einigermaßen leise auf Betriebstemperatur halten. Gekoppelt an dieses Speicherinterface waren generalüberholte ROP-Partitionen - sechs Stück, die jeweils vier Pixel gleichzeitig durchschleusen konnten. Nicht nur spendierte man ihnen die Fähigkeit, für jedes Pixel auch acht Z-Werte zu berechnen, auch single-Cycle 4x MSAA wurde ebenso geboten wie ein neuer 8x MSAA-Modus, welcher allerdings deutlich mehr Leistung als 4x kostete und bis heute kostet.

Um nicht nur wenige Chips zu hohen Preise unter das Volk bringen zu können und um die Ausbeute, also die Anzahl verkaufbarer Produkte pro Siliziumscheibe zu erhöhen, schaltete Nvidia bei der Geforce 8800 GTS kurzerhand zwei der acht Pixelprozessoren samt zugehöriger TMUs ab und kappte eine ROP-Partition samt 64-Bit-Speicherinterface - blieb also eine GPU mit 96 Shader-ALUs, 24/48 TA/TMUs, 320 Bit Speicherinterface und der krummen Zahl von 640 MiByte VRAM - die GTX hatte 768 MiByte, da jede 64-bittige ROP-Partition mit 128 MiB gekoppelt war.


Ati musste tatenlos zusehen, da sich der Hoffnungsträger R600 verspätete - darüber berichten wir im nächsten Teil des PCGH-Rückblicks.


Fehlt ein wichtige Detail oder stimmen Fakten nicht? Haben wir einen interessanten Aspekt oder gar einen Tippfehler übersehen? Nutzen Sie die Kommentarfunktion und teilen uns dies mit!

[index]


Bildergalerie zum Artikel
 
 
Alle Artikel zu Grafikkarten von Nvidia und AMD/Ati finden Sie auf der Grafik-Themenseite. Eine aktuelle Grafikkarten-Kaufberatung finden Sie im Artikel Ati- und Nvidia-Grafikkarten: Test-Übersicht und aktuelle Kauf-Tipps. Mehr zum Geforce-Entwickler Nvidia und Radeon-Entwickler AMD erfahren Sie in unseren Themen-Specials.
 
 
 
Verwandte Artikel:   Grafikkarten   Entwicklung   Ati   Nvidia   AMD  
 
 
  1. Gigabyte GeForce GTX 670 OC
    € 378.29
  2. Palit GeForce GTX 670
    € 344.99
  3. ASUS GTX670-DC2T-2GD5
    € 409.00
  4. Palit GeForce GTX 670 JetStream
    € 377.90
  5. ASUS GTX670-DC2-2GD5
    € 394.80
  6. Sapphire Radeon HD 7850
    € 209.80
  7. Sapphire Radeon HD 7850 OC
    € 218.90
  8. Gainward GeForce GTX 670 Phantom
    € 390.69
  9. Sapphire Radeon HD 7870
    € 284.30
  10. EVGA GeForce GTX 670
    € 357.99
 
Aktuelle Kommentare
frankreddien
BIOS-Overclocker
05.11.2008 18:57
AW: PCGH.de: PCGH Rückblick: Entwicklung der 3D-Grafikkarten (Teil 5)

Sehr interresanter Artikel. ATI und N.Vidia- die ewigen Konkurrenten.

PCGH_Carsten
Redakteur
03.11.2008 10:03
AW: PCGH.de: PCGH Rückblick: Entwicklung der 3D-Grafikkarten (Teil 5)

Quote: (Zitat von ILLmatik)
War nicht die X1950XTX die erste karte mit GDDR4 Ram?


Ja, so steht's ja auch im Text

ILLmatik
Komplett-PC-Käufer
02.11.2008 23:53
AW: PCGH.de: PCGH Rückblick: Entwicklung der 3D-Grafikkarten (Teil 5)

War nicht die X1950XTX die erste karte mit GDDR4 Ram?

 
 
1608 User online
Anmelden & mitmachen
Benutzername:
Kennwort:
Angemeldet bleiben
Jetzt mitdiskutieren!
Jetzt bestellbar!
Alles zu Crysis 3
Die besten Deals
Komplett-PCs von PCGH
Komplett-PCs von PCGH
So unterstützen Sie PCGH
Folgen Sie PCGH
Aktuelle Heft-Ausgabe
Wieviel Videospeicher hat deine aktuelle Grafikkarte?
Weniger als 512 MiByte (0.75%)
512 MiByte (5.77%)
640 MiByte (0.25%)
768 MiByte (0.75%)
896 MiByte (3.01%)
1.024 MiByte (37.52%)
1.280 MiByte (15.18%)
1.536 MiByte (9.54%)
1.792 MiByte (0.50%)
2.048 MiByte (18.57%)
2.560 MiByte (0.38%)
3.072 MiByte (6.02%)
4.096 MiByte (0.63%)
6.144 MiByte (0.75%)
Keine Angabe/sonstiges/weiß nicht (0.38%)
797 Teilnehmer
PCGH-Webshops