Vollausbau des Shader-Multiprozessors (SM) in Fermi [Quelle: siehe Bildergalerie]
Auf der GPU-Technology Konferenz 2009 hatte PC Games Hardware gestern die Gelegenheit, Nvidias General Manager of Tesla Business, Andy Keane über die Fermi-Architektur zu befragen. Dabei ging es vor allem um die Modularität des stark auf GPU-Computing optimierten Chip-Designs, welches Spieler auf den ersten Blick abschrecken könnte.
Unserem Gespräch zufolge nutzt Nvidia in den 32 Kernen der Shader-Multiprozessoren (SMs) jeweils eine separate Einheit für DFMA (Double-Precision Fused-Multiply-Add, also 64-Bit Multiplikation mit anschliessender Addition ohne das Zwischenergebnis der Multiplikation zu beschneiden), für Single-Precision FMA und eine zusätzliche Integer-Einheit - die DFMA-Einheit kann wahlweise auch für Single-Precision genutzt werden. Diese Vielzahl an Einheiten, die zudem nicht alle gleichzeitig genutzt werden können, wie Toni Tamasi zuvor bestätigte, bläht die Größe der einzelnen Prozessorkerne naheliegenderweise ziemlich auf, sodass der Fermi-Vollausbau relativ groß ausfallen dürfte - die Spekulationen für den 512-ALU-Chip liegen bei circa 500 mm². Entsprechend schwierig wäre es, hier kostengünstige Versionen für die Mittelklasse beziehungsweise den Spielermarkt zu liefern.
Wie uns Andy Keane nun verriet, ist die Fermi-Architektur weitaus modularer ausgelegt als es bislang den Anschein hatte. Natürlich kann Nvidia die Anzahl SIMD-Einheiten (16) oder die Zahl der Speichercontroller (6) variieren - wie schon in früheren Chips. Neu ist jedoch, dass für den Spielermarkt oder den Mainstream die Anzahl der DFMA-Einheiten unabhängig von den für Spiele und auch für Spieler-Physx wichtigen SDFMA-Einheiten reduziert werden und so den Chip deutlich "entschlacken" (rein aus Spielersicht) kann. Die Spieleleistung pro Quadratmillimeter Chipfläche und somit das Preis-Leistungsverhältnis aus Spielersicht kann dadurch merklich gesteigert werden.
Ebenfalls ist es möglich, die für Spielerkarten der Geforce-Reihe unwichtige ECC-Fehlerkorrektur zu deaktivieren und so die Performance um ein paar Prozent zu erhöhen. Nutzer von Tesla- oder Quadro-Karten können per Software-Eingriff (Treiber-Reload nötig) wahlweise zugunsten von ein paar Prozentpunkten Geschwindigkeit auf ECC verzichten, wenn ihre Anwendung die Fehlerkorrektur nicht benötigt.
Ein kleiner Rückblick auf unsere
bisherigen Artikel zur Fermi-Architektur und
weitere Details dazu: Der erste Fermi-Chip besteht aus 16 SIMDs (Shader-Multiprozessoren genannt, früher auch TPCs). Darin befinden sich jeweils 32 CUDA-Kerne (ALUs), 16 Load-Store-Einheiten, 4 Einheiten für Spezialfunktionen und zwei Warp-Scheduler und Instruktion-Issue-Einheiten. Inzwischen
bestätigte Nvidia, dass erste Fermi-basierte Grafikkarten gegen Jahresende veröffentlicht werden sollen.
Bildmaterial und Videos zur Physx-Beschleunigung finden Sie in einer
separaten Meldung.
Alle Artikel zu
Grafikkarten von Nvidia und AMD/Ati finden Sie auf der Grafik-Themenseite. Eine aktuelle Grafikkarten-Kaufberatung finden Sie im Artikel
Ati- und Nvidia-Grafikkarten: Test-Übersicht und aktuelle Kauf-Tipps. Mehr zum
Geforce-Entwickler Nvidia und
Radeon-Entwickler AMD erfahren Sie in unseren Themen-Specials.
Software-Overclocker
05.10.2009 17:16
Kein Geld?
Dass der GT300 schneller wird als die 5870 ist klar, aber:
-ATi hat von der 4890 auf die 5870 ALLE Einheiten verdoppelt
-nVidia hat von der GTX285 auf die GTX380 die Shader verdoppelt und die Taktrate um 15% erhöht, die TMUs um 60% erhöht und die ROPs um 50% erhöht.
Die 5870 ist ca. 40% schneller als die 4890. 2*5870 sind noch mal 50% schneller als eine einzelne. Warum sollte die GTX380 dann doppelt so schnell wie eine GTX285 sein?
Gesperrt
05.10.2009 11:14
Wie man an den Microrucklern sieht, ist Multi-GPU der falsche Weg. Zumindest für Leute, die wirklich spielen wollen. Angesichts dessen, dass ATI ja den Weg von kleinen, kombinierten Chips schon seit Jahren vertritt, hätte ich mir von ihnen eigentlich schon längst einen Fortschritt in Sachen Microrucklern erwartet. Im Endeffekt sogar eigentlich, dass sie das Problem Microruckler komplett lösen. Das ist wohl das Mindeste, um eine Dual-GPU-Karte als Pendant zu einer Single-GPU-Karte verkaufen zu können. Das allerdings bisher nur Nvidia Fortschritte in Sachen Microrucklern gemacht hat und ATI da seit Jahren auf der Stelle tritt, ist wirklich traurig.
Nach allen bisherigen Spezifikationen scheint wohl der Fermi in Single-Konfiguration den geplanten X2s von ATI kräftig Feuer unter dem Hintern zu machen. Ein paar Monate Verspätung sind auch normalerweise kein Problem, das hatten sowohl Nvidia (GeForce FX) als auch ATI (Radeon X1000) immer wieder mal und trotzdem leben beide heute noch.
Na da bin ich mal gespannt, ob wir diesen Sankt Nimmerleinstag noch erleben werden?
BIOS-Overclocker
05.10.2009 07:36
AMD hats bei cpus vorgemacht wie man effizient wenige verschiedene designes ausnutzt. Bei den GPUs hat man da wohl auch noch mehrere Chips, das wird dann aber mit dem zunehmenden durchsetzen von multi-gpu karten irgendwann auch verschwinden aber man baut wenigstens keine monsterchips mehr sondern ersetzt wenigstens das highend durch mehrere kleine.
Wenn Nvidia glück hat holen sie jetzt wieder mit nem trotzdem relativ großen chip das highend zurück 1chip vs 1chip, aber preisleistung wird man wohl wieder keine change haben, dazu noch die 3-5 Monatige verspätung, und wer weiß wie lange die dann noch brauchen um dann die 2Core version von amd abzulösen. Freut mich wirklich für amd jahrelange gute arbeit zahlt sich aus und so wie es aussieht muss nvidia die Marktführerschaft bald abtretten.
Schon alleine das Interview wo der gute gesagt hat das für ihn Hardware nicht so wichtig sei, dazu das gequatsche das dx10.1 nicht wichtig sei und jetzt nicht mal dx11 (bzw entsprechende opengl versionen) zeigt doch das nvidia sich nur noch auf cuda und physix konzentriert und alles darauf setzt, die Technik wird man aber nicht gegen Intel (Marktführer im grafikchip markt) und AMD (baldiger Marktführer bei dedizierten grafikkarten) durchdrücken können. amd hat ja jetzt nen offenen standard für physik auf opencl und oder dx11 angekündigt. Bei Dell und co hats Nvidia auch weitgehenst verschissen, dazu die arogante haltung gegenüber freien standards und Linux, sorry Nvidia RIP
Im großen und ganzen gebe ich dir recht. Nur darfst du nicht vergessen das NV immer noch der größte Fisch im Teich ist und das nicht um sonst.
Allerdings ist alles was bis jetzt von NV gekommen ist heiße Luft. Erzählen kann man viel. Den Beweis ist NV bis jetzt schuldig geblieben, wie die Vorstellung des .... Dummis.... bewiesen hat. Wie flecksiebel der Chip ist wird man sehen. Ich glaube NV im Moment nichts mehr. Sie haben zu viel versprochen und bis jetzt nichts gehalten. Ich warte mal ab