Nvidia Fermi: Schlanke Spielerkarten durch modularen Aufbau möglich
Nvidias Fermi-Architektur ist weit modularer als es bisher den Anschein hatte. Das könnte die Eignung und das Preis-Leistungsverhältnis von Fermi-basierten Grafikkarten für die Mittelklasse und den Spielermarkt nachhaltig beeinflussen. Andy Keane, Nvidias General Manager für Tesla, verriet Details im Gespräch mit PC Games Hardware.
Quelle: PC Games Hardware
Vollausbau des Shader-Multiprozessors (SM) in Fermi
Auf der GPU-Technology Konferenz 2009 hatte PC Games Hardware gestern die Gelegenheit, Nvidias General Manager of Tesla Business, Andy Keane über die Fermi-Architektur zu befragen. Dabei ging es vor allem um die Modularität des stark auf GPU-Computing optimierten Chip-Designs, welches Spieler auf den ersten Blick abschrecken könnte.
Unserem Gespräch zufolge nutzt Nvidia in den 32 Kernen der Shader-Multiprozessoren (SMs) jeweils eine separate Einheit für DFMA (Double-Precision Fused-Multiply-Add, also 64-Bit Multiplikation mit anschliessender Addition ohne das Zwischenergebnis der Multiplikation zu beschneiden), für Single-Precision FMA und eine zusätzliche Integer-Einheit - die DFMA-Einheit kann wahlweise auch für Single-Precision genutzt werden. Diese Vielzahl an Einheiten, die zudem nicht alle gleichzeitig genutzt werden können, wie Toni Tamasi zuvor bestätigte, bläht die Größe der einzelnen Prozessorkerne naheliegenderweise ziemlich auf, sodass der Fermi-Vollausbau relativ groß ausfallen dürfte - die Spekulationen für den 512-ALU-Chip liegen bei circa 500 mm². Entsprechend schwierig wäre es, hier kostengünstige Versionen für die Mittelklasse beziehungsweise den Spielermarkt zu liefern.
Wie uns Andy Keane nun verriet, ist die Fermi-Architektur weitaus modularer ausgelegt als es bislang den Anschein hatte. Natürlich kann Nvidia die Anzahl SIMD-Einheiten (16) oder die Zahl der Speichercontroller (6) variieren - wie schon in früheren Chips. Neu ist jedoch, dass für den Spielermarkt oder den Mainstream die Anzahl der DFMA-Einheiten unabhängig von den für Spiele und auch für Spieler-Physx wichtigen SDFMA-Einheiten reduziert werden und so den Chip deutlich "entschlacken" (rein aus Spielersicht) kann. Die Spieleleistung pro Quadratmillimeter Chipfläche und somit das Preis-Leistungsverhältnis aus Spielersicht kann dadurch merklich gesteigert werden.
Ebenfalls ist es möglich, die für Spielerkarten der Geforce-Reihe unwichtige ECC-Fehlerkorrektur zu deaktivieren und so die Performance um ein paar Prozent zu erhöhen. Nutzer von Tesla- oder Quadro-Karten können per Software-Eingriff (Treiber-Reload nötig) wahlweise zugunsten von ein paar Prozentpunkten Geschwindigkeit auf ECC verzichten, wenn ihre Anwendung die Fehlerkorrektur nicht benötigt.
Ein kleiner Rückblick auf unsere bisherigen Artikel zur Fermi-Architektur und weitere Details dazu: Der erste Fermi-Chip besteht aus 16 SIMDs (Shader-Multiprozessoren genannt, früher auch TPCs). Darin befinden sich jeweils 32 CUDA-Kerne (ALUs), 16 Load-Store-Einheiten, 4 Einheiten für Spezialfunktionen und zwei Warp-Scheduler und Instruktion-Issue-Einheiten. Inzwischen bestätigte Nvidia, dass erste Fermi-basierte Grafikkarten gegen Jahresende veröffentlicht werden sollen.
Bildergalerie
Bildmaterial und Videos zur Physx-Beschleunigung finden Sie in einer separaten Meldung.

Dass der GT300 schneller wird als die 5870 ist klar, aber:
-ATi hat von der 4890 auf die 5870 ALLE Einheiten verdoppelt
-nVidia hat von der GTX285 auf die GTX380 die Shader verdoppelt und die Taktrate um 15% erhöht, die TMUs um 60% erhöht und die ROPs um 50% erhöht.
Die 5870 ist ca. 40% schneller als die 4890. 2*5870 sind noch mal 50% schneller als eine einzelne. Warum sollte die GTX380 dann doppelt so schnell wie eine GTX285 sein?
AMD hats bei cpus vorgemacht wie man effizient wenige verschiedene designes ausnutzt. Bei den GPUs hat man da wohl auch noch mehrere Chips, das wird dann aber mit dem zunehmenden durchsetzen von multi-gpu karten irgendwann auch verschwinden aber man baut wenigstens keine monsterchips mehr sondern ersetzt wenigstens das highend durch mehrere kleine.
Wenn Nvidia glück hat holen sie jetzt wieder mit nem trotzdem relativ großen chip das highend zurück 1chip vs 1chip, aber preisleistung wird man wohl wieder keine change haben, dazu noch die 3-5 Monatige verspätung, und wer weiß wie lange die dann noch brauchen um dann die 2Core version von amd abzulösen. Freut mich wirklich für amd jahrelange gute arbeit zahlt sich aus und so wie es aussieht muss nvidia die Marktführerschaft bald abtretten.
Schon alleine das Interview wo der gute gesagt hat das für ihn Hardware nicht so wichtig sei, dazu das gequatsche das dx10.1 nicht wichtig sei und jetzt nicht mal dx11 (bzw entsprechende opengl versionen) zeigt doch das nvidia sich nur noch auf cuda und physix konzentriert und alles darauf setzt, die Technik wird man aber nicht gegen Intel (Marktführer im grafikchip markt) und AMD (baldiger Marktführer bei dedizierten grafikkarten) durchdrücken können. amd hat ja jetzt nen offenen standard für physik auf opencl und oder dx11 angekündigt. Bei Dell und co hats Nvidia auch weitgehenst verschissen, dazu die arogante haltung gegenüber freien standards und Linux, sorry Nvidia RIP
Im großen und ganzen gebe ich dir recht. Nur darfst du nicht vergessen das NV immer noch der größte Fisch im Teich ist und das nicht um sonst.
Allerdings ist alles was bis jetzt von NV gekommen ist heiße Luft. Erzählen kann man viel. Den Beweis ist NV bis jetzt schuldig geblieben, wie die Vorstellung des .... Dummis.... bewiesen hat. Wie flecksiebel der Chip ist wird man sehen. Ich glaube NV im Moment nichts mehr. Sie haben zu viel versprochen und bis jetzt nichts gehalten. Ich warte mal ab
ja schön, dann gibts 20 verschiedene chiplayouts am ende, was die kosten auch wieder hoch hält, und bei der letzten nvidia generation hat man gesehen wie schwer es schon ist wenige chips fehlerfrei zu bauen wenn man dann zig verschiedene layouts hat wird dies noch schwieriger, meiner ansicht nach mal wieder der falsche weg.
AMD hats bei cpus vorgemacht wie man effizient wenige verschiedene designes ausnutzt. Bei den GPUs hat man da wohl auch noch mehrere Chips, das wird dann aber mit dem zunehmenden durchsetzen von multi-gpu karten irgendwann auch verschwinden aber man baut wenigstens keine monsterchips mehr sondern ersetzt wenigstens das highend durch mehrere kleine.
Wenn Nvidia glück hat holen sie jetzt wieder mit nem trotzdem relativ großen chip das highend zurück 1chip vs 1chip, aber preisleistung wird man wohl wieder keine change haben, dazu noch die 3-5 Monatige verspätung, und wer weiß wie lange die dann noch brauchen um dann die 2Core version von amd abzulösen. Freut mich wirklich für amd jahrelange gute arbeit zahlt sich aus und so wie es aussieht muss nvidia die Marktführerschaft bald abtretten.
Schon alleine das Interview wo der gute gesagt hat das für ihn Hardware nicht so wichtig sei, dazu das gequatsche das dx10.1 nicht wichtig sei und jetzt nicht mal dx11 (bzw entsprechende opengl versionen) zeigt doch das nvidia sich nur noch auf cuda und physix konzentriert und alles darauf setzt, die Technik wird man aber nicht gegen Intel (Marktführer im grafikchip markt) und AMD (baldiger Marktführer bei dedizierten grafikkarten) durchdrücken können. amd hat ja jetzt nen offenen standard für physik auf opencl und oder dx11 angekündigt. Bei Dell und co hats Nvidia auch weitgehenst verschissen, dazu die arogante haltung gegenüber freien standards und Linux, sorry Nvidia RIP
Ist doch egal wie gross der Chip ist, solang jener im idle sich seeeehr genügsam zeigt, im 3D auch weiß, daß es Strom net umsonst gibt und neuerdings dann wohl, da nvidia ja ach so modular geworden ist, entsprechend nach application unnötigen Quark vom Netz trennt um so zusätzlich Strom zu sparen.
GT300 hat brachiale Leistung? we will see