PCGH History: Lesen Sie Teil 2 unserer Geschichtsstunde. [Quelle: siehe Bildergalerie]
Nachdem der
erste Teil unserer kleinen VGA-Geschichtsstunde sich mit der Sturm- und Drangzeit der
3D-Grafikkarten beschäftigte, kommen wir heute nach einem kurzen Rückblick zur (kurzen) Blütezeit der
TnL-Karten und arbeiten uns zur ersten
Pixel-Shader-Generation mit Modellen wie Nvidia
Geforce 3 und Ati
Radeon 8500 vor. Auch die interessanten Deferred-Renderer der Kyro-Reihe von Power-VR/Imgtec lassen wir dabei nicht außer Acht.
Was wir Ihnen - falls sie den
ersten Teil der Reihe nicht gelesen haben - allerdings vorab verdeutlichen möchten, ist die rasante Entwicklung, welche 3D-Chips im Laufe der Jahre durchgemacht haben. Dazu haben wir die Zunahme der Leistungsfähigkeit in verschiedenen, für 3D-Chips wichtigen Bereichen in Balkenform gebracht. Staunen Sie mit uns, wie enorm die Fortschritte der 3D-Grafikchips seit deren Kindertagen sind.
Lesen Sie auf der nächsten Seite: Die Anfangstage: Das haben Sie in Teil 1 verpasst und 2000: 3dfx' Voodoo-Magie... Die Anfangstage: Das haben Sie in Teil 1 verpasst Keine Sorge, wirklich verpasst haben Sie nichts, da der
erste Teil nach wie vor einsehbar ist. Nachdem 3Dfx mit der Voodoo Graphics 1996 den noch jungen 3D-Thron an sich gerissen und eisern umklammert hielt, versuchten sich Firmen wie Nvidia, Ati, Matrox und andere daran, einen Teil des neuen Marktes zu reservieren. Noch bevor deren erste Gehversuche im 3D-Markt namens Riva128, Rage IIc oder die betagte Millenium II auch nur zur Voodoo Graphics aufschließen konnten, brachte 3Dfx mit der Voodoo2, welche sogar im SLI zu betreiben war, den Todesstoß für diese Produkte. Die Jagd nach dem Voodoo-2-Killer führte 1999 schließlich zu Nvidia Riva TNT2, Rage Fury MAXX, Matrox G400 sowie der Voodoo3 von Altmeister 3dfx. Im Herbst 1999 betraten schließlich die ersten Chips mit integrierter Geometriebeschleunigung, auch Hardware-TnL genannt, die Bühne: Der Savage 2000 von S3 Graphics und Nvidias Geforce 256. Besonders Letztere konnte zumindest in 16 Bit Farbtiefe die Konkurrenz inklusive der einst übermächtigen Voodoo-Karten von 3Dfx hinter sich lassen und stellte die insgesamt schnellste Karte des Jahres 1999 dar. In 32 Bit waren ihr aufgrund von geringer Speicherbandbreite und schlechter Ausnutzung derselben allerdings die Lösungen von Matrox (G400 MAX) und Ati (Rage Fury MAXX) oft um eine Nasenlänge voraus.
2000: 3dfx' Voodoo-Magie muss sich gegen den GF-Refresh behaupten, AMD betritt mit der Radeon die Bühne 3Dfx hatte sich jahrelang auf der Technik der originalen Voodoo Graphics ausgeruht und in der Hinterhand einen neuen Chip mit dem Codenamen Napalm entwickelt. Als dieser mit großer Verspätung endlich fertig war und auf den Markt kommen konnte, musste er sich nicht wie geplant mit der Geforce herumschlagen und auch nicht mit der bandbreitenstärkeren Geforce DDR sondern mit deren Nachfolger Geforce 2. 3dfx, wie sich die Firma inzwischen nannte, wollte mit der Voodoo4 4500, Voodoo5 5500 und Voodoo5 6000 gleich drei neue Serien herausbringen, welche allesamt auf dem VSA-100 genannten Chip basierten. VSA stand für "Voodoo Scalable Architecture" und dieser Name war Programm: Die Voodoo4 4500 sollte über einen der Chips, Voodoo5 5500 über zwei und Voodoo5 6000 gar über vier Chips verfügen, welche alle per SLI zur Bildbeschleunigung beitrugen. Aufgrund technischer und zeitlicher Probleme konnten allerdings nur die ersten beiden Karten in die Massenproduktion gebracht werden, von der Voodoo5 6000 existieren weltweit nur ca. 100 Modelle, welche mit selbstgebastelten Treibern noch immer die Herzen der Liebhaber erfreuen.
Der VSA-100 VSA-100 bedeutete auch endlich den Einzug von inzwischen zum Standard gewordenen Features wie 32-Bit-Rendering, modernerer Texturkompression und Bump-Mapping, um nur einige zu nennen. Was den VSA-100 aber wirklich besonders machte, war die Fähigkeit jedes Chips per Vertex-Jittering sogenannte Rotated-Grid-Antialiasing zu erzeugen. Beim damals noch üblichen Super-Sampling-AA wurde jedes Bild n-Mal mit einem leichten Offset komplett gerendert und diese im sogenannten T-Buffer abgelegten Informationen hinterher wieder zusammengefügt. Daraus entstand eine bis heute kaum erreichte Anti-Aliasing-Qualität, denn obwohl der Einzelchip auf einer Voodoo4 4500 lediglich 2x FSAA bot, konnte eine Multi-Chip-Konfiguration die beiden Samples jedes Chips kombinieren, sodass die Voodoo5 5500 4x SGSSAA bot und die Voodoo5 6000 sogar bis zu 8x SGSSAA. Kollege Raffael Vötter hat bereits einige Artikel veröffentlicht, welche die Qualität dieser Lösung unter Beweis stellen.
Lesen Sie auf der nächsten Seite: 3dfx-Schock: Die Pleite und Geforce-Updates und Update-Updates... 3dfx-Schock: Die Pleite Warum 3dfx im Dezember 2000 trotzdem die Pforten schließen und Patente und Markenrechte an Nvidia verkaufte lag vermutlich an mehreren Dingen: Zum einen sollen seit der Übernahme der STB-Fabrik bei 3dfx mehr und mehr die Marketing-Leute das Sagen übernommen haben und die Ingenieure, welche bis zum Sxhluss mit hoffnungslos veralteten Design-Tools arbeiten mussten, kamen nicht mehr zum Zuge. Zum anderen lief die Marketing-Maschinerie Nvidias, Microsofts und später auch Atis auf Hochtouren, um das Killer-Feature der neuen Direct-X-Version 7 und der passenden Chips Geforce und Radeon anzupreisen: Hardware-TnL. Da es zu Lebzeiten der Karten kaum eine Bedeutung bei Spielen erlangte, war das einzige, was dieser Hardware-Block in den Chips wirklich tötete die Firma 3dfx.
In der damals wichtigen Benchmark-Welt, in welcher hauptsächlich ein indiziertes MP-Spiel von id-Software, ein ebenfalls indizierter Multiplayer-Shooter von Epic und der TnL-unterstützende 3D Mark 2000 von Madonion, wie Futuremark früher hieß, zum Zuge kamen, konnte das Performance-Flaggschiff Voodoo5 5500 nur schwer mithalten, da trotz andauernden propagierens von 32-Bit-Rendering viele Benchmarks noch in 16 Bit Farbtiefe entstanden, welche den Geforce-Karten eher lag. In 32 Bit und besonders bei Spielen, welche noch über einen Pfad in der proprietären 3dfx-API Glide verfügten, sah die Voodoo5 5500 oft nicht schlecht gegenüber der Geforce 2 GTS aus, welche zu diesem Zeitpunkt allerdings schon nicht mehr Nvidias Top-Modell darstellte.
Geforce-Updates und Update-Updates Nvidia hatte das größte Problem der Ur-Geforce - die mangelnde Speicherleistung - offenbar frühzeitig erkannt und konnte nur wenige Monate nach deren Veröffentlichung bereits eine Variante mit Unterstützung für DDR-RAM (Double Data Rate, doppelte Datenrate) bereitstellen. Dieser Speichertyp arbeitet bei gleicher Frequenz fast doppelt so schnell wie herkömmlicher SDR-RAM (Single Data Rate, einfache Datenrate), indem er pro Takt zweimal ein komplettes Datenpaket überträgt. Parameter wie zum Beispiel Latenzen ändern sich jedoch nicht, sodass die doppelte Geschwindigkeit meist nicht erreicht wird. Neben dieser DDR-Geforce kam aus der Hinterhand noch ein "echter" Refresh der Geforce-Reihe - kreativ Geforce 2 betitelt. Deren Standardversion, die Geforce 2 GTS, verfügte im Vergleich zur Geforce nochmals über einen höheren Takt (166 zu 120 Megahertz) und über zweimal soviele Textureinheiten (acht anstelle von vier), sodass die wichtige Texel-Füllrate mehr als verdoppelt wurde. Das schlug sich auch im Namen nieder, denn das GTS steht für nichts anderes als "Giga-Texel-Shader" - auch wenn das "Shader" für heutige Verhältnisse etwas hochgegriffen scheint. Ermöglicht wurde diese Funktionsdichte durch den Wechsel auf einen moderneren Fertigungsprozess, welcher zusätzlich Wärmeentwicklung und Leistungsaufnahme - ein großes Problem noch der ersten Geforce-Generation in Verbindung mit bestimmten Mainboards - zugute kam.
Der wirklich entscheidende Schritt kam aber ein wenig später mit dem NV11. Hierbei handelte es sich um eine abgespeckte Geforce 2 die mit nur zwei Pixel-Pipelines à zwei Textureinheiten und 128-bittigem SDR-RAM (es gab auch Modelle mit 64-Bit-DDR-RAM) taktbereinigt wieder auf dem Niveau der alten Geforce lag. Allerdings verfügte Sie sowohl über den prestigeträchtigen Namen Geforce als auch über das komplette Featureset der großen Geschwister. Dank des günstigen Preises entwickelte sie sich zum Verkaufssschlager und trug maßgeblich zu Nvidias enormem finanziellen Erfolg und den ebenso schnell wachsendem Marktanteil der Geforce-Karten bei. Neben Geforce 2 MX und GTS, sowie der schneller getakteten Pro-Version, bot Nvidia kurz vor Jahresschluss die vermutlich als Konkurrent zur Voodoo5 5500 geplante Geforce 2 Ultra an. Diese selektierten Chips erreichten die damals enorme Taktrate von 250 Megahertz und damit erstmals eine Füllrate von über 2 Gigatexel Pro Sekunde.
Lesen Sie auf der nächsten Seite: Ati schlägt zurück und Kyro!... Ati schlägt zurück Trotz der bislang nur wenig konkurrenzfähigen 3D-Spielerchips konnten die Kanadier dank günstiger Preise und gute Kontrakte im OEM-Geschäft ihre finanzielle Basis sichern. Im Hintergrund war die heutige Grafiksparte von AMD allerdings nicht untätig und hatte einen eigenen TnL-Chip entwickelt, deren Name noch heute die Grafikchips von AMD ziert: Den Radeon. Dieser verfügte neben H-TnL über mehr Features als die konkurrierenden Geforce-Chips und schrammte nur knapp an der Pixel-Shader-Spezifikation in Version 1.1 vorbei, welche für Direct X 8 erforderlich war. Um Kosten zu sparen, hatte man bei Ati ein ungewöhnliche Konfiguration von zwei Pixelpipelines mit jeweils drei Textureinheiten gewählt, die dem Chip auf dem Papier eine Füllrate ermöglichte, welche zwischen Voodoo5 5500 und Geforce 2 GTS lag.
Die Besonderheit des Chips lag in der Möglichkeit, mithilfe eines hierarchischen Tiefentests und weiteren Optimierungen des Z-Buffer wie dessen schnellem Löschen, besonders effiizient mit der Speicherbandbreite umzugehen. Der Z-Buffer war damals im Vergleich zu heute im allgmeinen noch recht unoptimiert und verschlang neben den Texturzugriffen einen großen Teil der Bandbreite, was besonders die 32-Bit-Leistung der Chips schmälerte. Hiermit machte die Radeon erst einmal Schluss und konnte neben konkurrenzfähiger, wenn auch nicht überragender 16-Bit-Leistung besonders in 32 Bit den (Verschwender-) Primus Geforce ein ums andere Mal ordentlich ärgern. Und das, obwohl die eigentlich geplanten 183 Megahertz der ersten Review-Samples für Chip und VRAM in der Serienproduktion nicht erreicht wurden: Das Topmodell war die Radeon DDR mit 64 MiByte und 166 Megahertz während die Radeon SDR mit 32 MiByte und 143 Megahertz gegen die Geforce 2 MX antrat (und oft gewann...).
Und sonst noch? Nach der gnadenlosen 3D-Schlacht, welche bereits seit 1999 tobte, blieben nicht mehr viele Spieler auf dem Feld übrig. Intel konzentrierte sich nach den im Einzelhandel erfolglosen i740/i752-Versuchen mit zugekaufte Real3D-Technologie auf integrierte Grafik für seine Mainboardchipsätze. Kleinere Firmen wie Rendition mussten die Segel streichen, von den Bitboys Oy (heute Teil von AMD/Ati) kam ausser einem (nicht funktionsfähigen?) Prototypen des auf dem Papier vielversprechenden Pyramid3D (Glaze3D) nur noch heisse Luft und selbst den ehemaligen Marktführer 3dfx erwischte es Ende 2000. Matrox hatte sich dank der ausgefeilten und innovativen Multi-Monitor-Fähigkeiten seiner G400-Chips eine Marktnische geschaffen, spielte trotz Refreshes auf die in Sachen 3D nicht leistungsfähigeren G450 aber im Spielermarkt keine Rolle mehr. Auch die folgende G550 bot mit Headcasting, einer Möglichkeit, 3D-Modelle mit eigenem Foto als Videokonferenz-Avatar zu nutzen und so die kostbare Internet-Bandbreite zu sparen, eher Features für die Geschäftswelt.
Kyro! Lediglich PowerVR, deren glückloser Neon250 ihnen zum Glück nicht das Genick gebrochen hatte, brachten 2000 noch eine bemerkenswerte Lösung auf den Markt: Die Kyro. Dieser Chip, blieb zwar kommerziell relativ erfolglos - soviel sei vorab gesagt - wurde in großen Teilen der Webwelt damals eher belächelt, brachte er doch mit gerade mal zwei Pixel-Pipelines und 115 Megehertz Eckdaten auf die Fps-Waage, welche seit einem Jahr als überholt galten. Doch diejenigen, welche einen zweiten Blick wagten (dazu gehörte sogar Nvidia...), wurden belohnt. Mit 64 MiB SDR-RAM ausgestattet nutzte er eine konsequente Weiterenticklung der bereits in früheren Power-VR-Produkten zum Einsatz gekommenen Deferred-Rendering-Techniken. Diese wurde durch das kachelbasierte Renderingkonzept nochmals verbessert.
Effiizienzwunder TBDR Im Gegensatz zu sogenannten Immediat-Mode-Renderern (allen anderen damals aktuellen Chips) sammelt ein TBDR (Tile-Based-Deferred-Renderer) vom Schlage eines Kyro alle Informationen, welche für ein Bild benötigt werden in einem Puffer. Danach wird das komplette Bild von der Bildschirmauflösung aus in (kleine) Kacheln zerlegt und diese werden einzeln gerendert. Durch die Zerlegung passen sämtliche zu einer Kachel gehörenden Tiefeninformationen in einen extrem schnellen Zwischenspeicher und die Bildoperationen kosten keine weitere Bandbreite zum VRAM (außer dem Zurückschreiben der fix und fertigen Kachel in den Framebuffer). Außerdem wird eine vorgezogene Tiefenanalyse vorgenommen, sodass der Chip auch wirklich nur die Pixel berechnen muss, die hinterher auch sichtbar sind - das war damals eine kleine Revolution und der Außenseiter Kyro konnte so ein ums andere Mal selbst die übermächtig erscheinende Geforce-2 ins Schwitzen bringen.
So gelungen war das Konzept, dass Nvidia sich genötigt sah, eine interne Schulung für die Verkaufsabteilung abzuhalten, in der (nach der ins Internet gelangten Präsentation) die Möglichkeiten des Kyro kleingeredet wurden. Unter anderem wurde auf das fehlende TnL verwiesen und die Kyro als "TNT-class Product" abgestempelt.
Lesen Sie auf der nächsten Seite: 2001: Als die Pixel rennen lernten... 2001: Als die Pixel rennen lernten Neben weiteren SKU-Ablegern sowohl der Geforce 2 als auch von Atis Radeon, brachte das neue Jahr vor allem eines: Eine neue Version von Direct X. Diese wurde auch sogleich im 3D Mark 2001 unterstützt und es dauerte nicht lange, bis auch die erste Pixel-Shader-Hardware verfügbar war. Dabei handelte es sich, nachdem Microsoft die erforderliche Spezifikation auf Version 1.1 in Direct X 8 festgeschrieben hatte, um die Geforce 3.
Doch der Reihe nach. Wie erwähnt, diversifizierten Ati und Nvidia ihre erfolgreichen Radeon- und Geforce-Reihen weiter , um ja auch jedes Preissegment abdecken zu können. Dabei kam mit der Geforce 2 Ti, einem Hybriden aus Geforce 2 Pro und Ultra, und der Geforce 2 MX in Versionen mit angehängtem 100, 200 und 400 auch eine Radeon heraus, welche endlich mit den urpsprünglich geplanten 183 MHz taktete, aber nur über eine Pixel-Pipeline verfügte. Dieser Radeon VE war darüberhinaus auch die TnL-Einheit per Treiber abgeschaltet worden. Dafür bot sie mit Hydravision eine durchaus gelungene Multi-Monitor-Unterstützung, die der der Geforce-2-MX überlegen war.
Enter the Geforce 3 Im Frühjahr war es dann soweit. Mit nur 200 Megahertz Chiptakt und einer Pipeline-Konfiguration wie bei der Geforce 2 sollte die Geforce 3 neben der Technologieführerschaft durch Shader-Unterstützung auch die Fps-Krone für Nvidia sichern. Doch noch immer hatten sich viele Reviewer nicht von der 16-Bit-Vergangenheit verabschiedet und so entstand die kuriose Situation, dass die Geforce 3 zwar in modernen 32-Bit-Setting dank ausgeklügelter Technologien schneller als bisherige Karten war, unter 16 Bit zuweilen aber Federn lassen musste. Die Verbesserungen, welche neben den ersten Pixel- und Vertex-Shadern in den NV20 genannten Chip einflossen, waren ein unterteilter Speicherkontroller, durch den die Zugriffe auf das VRAM effizienter vonstatten gingen und der Einbruch in 32 Bit geringer ausfiel. Die eigentlich Revolution war allerdings die Unterstützung von 2x Rotated-Grid-Multi-Sampling-FSAA. Diese Technik - erstmal bei einer Spielerkarte zum Einsatz kommend und von Nvidia zuvor noch als "harmless cheating/economization of Super-Sampling" bezeichnet - ermöglichte Anti-Aliasing ohne potenziell die Hälfte der Grafikleistung einzubüßen, da lediglich Geometriekanten mit der höheren Auflösung abgetastet werden anstelle jedes einzelnen Pixels. Durch Rotated-Grid-Anordnung bot sich hier im 2x-Setting erstmal eine Kantenglättung vergleichbar der von 3dfx (welche allerdings das komplette Bild inklusive Texturen verbesserte). Für 4x FSAA war leider weiterhin nur ein geordnetes Raster verfügbar, welches bei starkem Leistungseinbruch nur wenig zusätzliche Qualität lieferte.
Mit Pixel-Shader-Einsatz war auf der Geforce erstmals die Nutzung des von Matrox und Ati bereits seit längerem unterstütztem Environment-Mapped Bump-Mapping, der damals besten Bump-Mapping-Variante, möglich. Der programmierbare Vertex-Shader konnte der CPU nun theoretisch zusätzliche Arbeit abnehmen, aber auf eine Unterstützung in Spielen wartete man, wie bei allen Technologien, noch eine ganze Weile. Eines der ersten Spiele, welche "hübsche" Pixel-Shader-Oberflächen für Wasser anboten - welche optisch eher Quecksilberpfützen ähnelten - war The Elder Scrolls III: Morrowind. Doch der 3D Mark 2001 war frühzeitig zur Stelle um dieses Manko auszubügeln und so gab es einen in die Gesamtwertung einfliessenden Test, welcher nur mit Pixel-Shadern ausführbar war und der Geforce 3 gemeinhin die Performancekrone ermöglichte, falls in den wenigen getesteten Spielen ein Zweifel bestanden hätte.
Power VR legt einen Zahn zu Nach der kaum bekannten Kyro konnte Power VR mit der taktseitig deutlich beschleunigten Kyro II im Jahre 2001 einen weiteren Achtungserfolg hinlegen. Die mit 175 MHz taktende Karte wurde unter anderem von Videologic, Hercules und Innovision eingesetzt und konnte ein Titeln ohne TnL-Unterstützung oder mit hoher Texturlast und Overdraw endlich auch eine Geforce 2 schlagen - manchmal sogar die Geforce 3. Das zugrunde liegende Konzept haben wir bereits weiter oben erläuftert - bis auf einen etwas größeren Cache, welcher der gestiegenen Dreiecksmenge eines durchschnittlichen Spiels geschuldet war, hat Power VR keine größeren Veränderungen vorgenommen - wozu auch?
Ati schlägt zurück Fast schon gegen Ende des Jahres brachte Ati endlich seine neuen Modelle auf den Markt - und was für welche. Die Radeon 7500 war eine Best-of-both-Worlds-Mischung der Radeon und der Radeon VE - zusammen mit enormer Taktrate durch modernen Fertigungsprozess. Neben dem kompletten Feature-Set der bis zu 166 Megahertz schnellen Radeon 64 verfügte das neue Modell auch über die Multi-Monitor-Unterstützung der Radeon VE - kombiniert mit einem Chiptakt von sagenhaften 290 Megahertz und 230 Megahertz schnellem DDR-RAM bot sie der Geforce 2 Ultra Paroli und kostete deutlich weniger.
Das neue Flaggschiff war aber ein anderer Chip: Der überaus ambintioniert R200. Dieser sollte über SGMSAA (also die sparsame Version der überragenenden 3dfxschen FSAA) verfügen, 16:1 anisotrop filtern können und im Gegensatz zur Geforce 3 sogar die Pixel-Shader-Version 1.4 unterstützen. Leider litt der Chip unter einigen Fehlern im Design und konnte das SG-FSAA nur unter bestimmten Bedingungen nutzen, sodass zumeist auf langsames Super-Sampling (immerhin bis zu 6x SSAA) genutzt werden musste. Deutlich schneller, aber dafür weniger schön geriet die Implementierung des anisotropen Texturfilters: Bei dessen Benutzung wurde automatisch von tri- auf bilinear zurückgeschaltet und zudem litt der Filter an Genauigkeitsproblemen und starker Winkelabhängigkeit. Man hatte letztendlich also die Wahl zwischen brauchbarer trilinearer Filterung oder bilinearer Anisotropie mit starker Flimmerneigung und Winkelschwäche - die jedoch, wie man anmerken muss, im Gegensatz zum AF der Geforce 3, kaum Fps-Leistung kostete.
Dass die Radeon 8500 sich trotzdem gut verkaufte, lag unter anderem an ihrer mehr als nur konkurrenzfähigen Leistung. Dank hoher Taktraten von 275 Megahertz für Chip und Speicher sowie der weiter verbesserten Effiizienz-Merkmale der Vorgängermodelle (Hyper-Z) konnte die Geforce 3 nur selten mithalten. Zudem konnte Ati mit dem Phasen-Konzept des Pixel-Shader 1.4 bereits einen wichtigen Grundstein für den Chip legen, mit dem alles besser werden sollte und um den sich unter anderem der nächste Teil der PCGH-History dreht.
Ach ja: Auch 2001 gab es eine interessante Techdemo. Mithilfe von Pixel-Shader-Unterstützung stellte das Projekt des jungen Crytek-Teams Dinosaurier in verschiedenen Reflektions- und Refraktionsformen auf einer palmenüberwucherten Südseeinsel dar... ;-)
Bildergalerie zum Artikel