Geforce 100 Fermi Deep Dive Opening [Quelle: siehe Bildergalerie]
"We are a gaming company, first and foremost" - Mit diesen wohlbedachten Worten leitete Nvidias frisch gebackener General Manager für Desktop-Business, Drew Henry, den "Architecture Deep Dive" zur Geforce-Grafikkarte auf Fermi-Basis, Codename GF100, ein. Zuvor, auf der GPU-Technology-Conference im September 2009, war bereits die grundlegende Fermi-Architektur, allerdings mit Fokus auf den GPU-Computing Fähigkeiten von Fermi vorgestellt worden und viele PC-Spieler beklagten, Nvidia hätte seine Kernzielgruppe aus den Augen verloren.
Im Laufe des Tages präsentierten die Nvidia-Mannen weitere Architektur-Details der Grafikkarte GF100-Fermi. Dieses Mal mit deutlichem Fokus auf die Verbesserungen, welche Fermi dem PC-Spieler bringen soll. PC Games Hardware erklärt im Folgenden die wesentlichen Details der Nvidia-Präsentation, bei der GF100-Fermi unter dem Motto "Geometric Realism" präsentiert wurde.
Geforce 100 Fermi Tesla based card [Quelle: siehe Bildergalerie]
Achtung: Fermi / GF100 ohne eigene Benchmarks! Sowohl die zur Schau gestellten Fermi-Grafikkarten als auch die Benchmarks sind nur zum Angucken, nicht zum Anfassen gewesen. Die Benchmarks sind von Nvidia ausgewählt und angefertigt worden, sodass wir keinen Einfluss auf deren Aussagekraft für die allgemeine Leistungsfähigkeit haben. Die gezeigten Fermi-Grafikkarten (s. Bild oben) sind ebenfalls noch nicht final und werden zur endgültigen Produktreife wahrscheinlich noch einmal neu designed. Auch liefen die Lüfter mit einer festgelegten Drehzahl, eine Lüftersteuerung war nicht aktiviert. Aussagen zur Geräusch- und Wärmeentwicklung der Karten entbehren somit jeder Grundlage.
Nvidia Fermi GF100 Grafikkarte Architektur Preview 01 [Quelle: siehe Bildergalerie]
Fermi / GF100: Der Chip im Überblick Wie bereits in unserem recht ausführlichen
Fermi-Architektur-Preview, Teil 1 erwähnt, integrierten Nvidias Ingenieure auf dem (ersten) Fermi-Chip rund 3 Milliarden Transistoren - AMDs Cypress-GPU kommt hier auf 2,15 Mrd. Schaltungen. Beide Chips werden in TSMCs 40nm-Prozess hergestellt, teilen sich also
die Unbillen dieser Strukturtechnik. Unterstellt man, dass Nvidia dieselbe Packdichte erreicht wie AMD, dürfte der Fermi-GF100 rund 490 Quadratmillimeter groß werden. Legt man die Packdichte zugrunde, welche Nvidias bis dato größter 40nm-Chip GT215 erreicht, betrüge die Die-Größe bereits 574 Quadratmillimeter. Eine offizielle Angabe von Nvidia existiert diesbezüglich nicht.
Im Überblick besteht ein Fermi-Chip aus vier GPCs - das steht für Graphics (oder General) Processing Cluster -, sechs Speichercontrollern inklusive ROPs und Level-2-Cache, dem Host-Interface zur Kommunikation mit dem Wirts-PC sowie dem Steuerwerk namens "Giga-Thread-Engine". Details zu den einzelnen Einheiten folgen im Anschluss.
Geforce 100 Fermi Chip Overview 2 [Quelle: siehe Bildergalerie]
Fermi / GF100 "Speeds and Feeds": Insgesamt kommen wir für einen Fermi-Chip im Vollausbau auf die folgende Anzahl der jeweiligen Einheiten und Durchsätze pro Takt:
• 1 Host-Interface
• 1 Giga-Thread-Engine
• 4 Rasterisierungs-Einheiten ("Rasterizers")
• 16 Geometrie-Einheiten ("Polymorph-Engines")
• 512 Shader-ALUs (Cuda-Cores)
• 64 Textureinheiten (TMUs)
• 48 Raster-Operatoren in sechs Gruppen à 8 ROPs
• 384 Bit breiter, in sechs Gruppen aufgeteilter GDDR5-Speichercontroller
• 768 kiB Level-2-Cache (voll kohärent, Lese- und Schreibzugriffe)
Pro Takt lassen sich folgende Durchsätze erzielen:
• 512 FMA/MAD-Anweisungen pro Takt (Single-Precision, 32 Bit)
• 256 FMA/MAD-Anweisungen pro Takt (Double-Precision, 64 Bit)
• 4 Dreiecke pro Takt
• 32 rasterisierte Pixel pro Takt
• 384 Tiefenvergleiche pro Takt (Z-tests)
Die folgende Tabelle stellt den Vergleich der bekannten und gesicherten Eckdaten mit dem Vorgänger in Form der Geforce GTX 285 und der Konkurrenz in Form der Radeon HD 5870 her.
| Hersteller |
Nvidia Geforce |
|
AMD/Ati Radeon |
| |
"GF100" |
GTX 285 |
HD 5870 |
| Ca.-Preis (Euro) |
? |
300,- |
350,- |
| Chip |
Fermi-Full |
GT200(b) |
Cypress |
| Fertigung (Nanometer) |
40 |
55 |
40 |
| Transistoren (Mio.) |
3.000 |
1.400 |
2.150 |
| Taktrate Chipkern (MHz) |
? |
648 |
850 |
| Taktrate Shader-ALUs (MHz) |
? |
1.476 |
850 |
| Taktrate Speicher (MHz) |
? |
1.242 |
2.400* |
| Shader-Version/Direct X |
5.0/11 |
4.0/10 |
5.0/11 |
| Shader-ALUs |
512 |
240 |
1.600 |
| Textureinheiten |
64 |
80 |
80 |
| ROPs |
48 |
32 |
32 |
| Übliche Speichermenge (MiByte) |
1.536 |
1.024 |
1.024 |
| Speicherbus (Bit) |
384 |
512 |
256 |
| Speichertyp |
GDDR5 |
GDDR3 |
GDDR5 |
| MAD-Leistung (GFLOP/s) |
? |
708,5 |
1.360 |
| Triangles/clock |
4 |
1 |
1 |
| Texturfüllrate (MTex/s) |
? |
51.840 |
68.000 |
| Speicherbandbreite (MiByte/s) |
? |
158.976 |
153.600 |
| Multi-Sampling, max. |
8x |
8x |
8x |
| Anti-Aliasing, max. |
32x CSAA |
16xQ CSAA, 32xS |
8x SGSS, 24x CFAA |
| Multi-GPU |
3-Way-SLI |
3-Way-SLI |
Crossfire X |
| PCI-E.-Stromanschl. (6-Pin/8-Pin) |
1 x/1 x |
2 x/0 x |
2 x/0 x |
| Länge Grafikkarte (ca.-Angabe, mm) |
267 |
267 |
282 |
Wenn Sie mehr über den
Nvidia GF100 erfahren wollen, gibt es dazu einen separaten Artikel. Alles zu
Radeon- und Geforce-Grafikkarten finden Sie auf der Grafikkarten-Produktseite. Darüber hinaus gibt es
Grafikkarten-Tests für Radeon und Geforce. Eine aktuelle Grafikkarten-Kaufberatung finden Sie im Artikel
Ati- und Nvidia-Grafikkarten: Test-Übersicht und aktuelle Kauf-Tipps. Den
Download von Nvidia-Geforce-Treibern sowie den
Download von Ati-Radeon-Treibern finden Sie immer aktuell bei PC Games Hardware
PC-Selbstbauer
24.01.2010 18:01
@The_Final:
Okay da habe ich vielleicht zu schnell gelesen. Leistungsmäßig denke ich das Fermi besser sein wird als ATI, die Frage ist dann natürlich wieder, wieviel besser bei wieviel mehr Kosten. Im Endeffekt muss man natürlich abwarten bis die ersten Karten raus sind, was im schlimmsten Fall erst im April sein wird.
Wenn die Karten raus sind, werden mit ziemlicher Sicherheit auch die Radeons billiger, von daher kann man eigentlich nur gewinnen.
Kabelverknoter
24.01.2010 13:21
ich spiel immernoch mit meiner Geforce 9800gx2 sowie einen q6600 und kann bis dato eh noch alle spiele auf 1600 x 1200 (CRT) flüssig spielen.
Wenn diese jahr noch so 4-5 titel mit DX11 rauskommen werd ich mal die berichte über dieleistung in den spielen der einzelnen Karten lesen bzw beobachten und kauf mir dann eine dx11 karte.
Solange man keinen neuen Rechner kauft gebe ich dir Recht, momentan schickt mir sogar noch meine Radeon 1950 XTX die zig Jahre alt ist und noch nicht mal DirectX10 verwenden kann. Die Sache ist aber eine andere wenn man sich einen neuen Rechner kauft, so wie ich es demnächst vor habe. Dann steht man nämlich vor der Wahl erstmal Geld für eine DirectX 10 Karte auszugeben und später nochmal Geld für eine DX11 Karte. Hier ist natürlich voraussgesetzt, dass man eine DX11 Karte haben will und dass einem nicht egal ist. Ich stehe hier nun auf dem Standpunkt, dass ich mir lieber jetzt eine DX11 Karte kaufe, die hoffentlich zwei bis drei Jahre hält, anstatt zweimal Grafikkarten zu kaufen. Im Endeffekt muss das natürlich jeder selber wissen.
@The_Final:
Okay da habe ich vielleicht zu schnell gelesen. Leistungsmäßig denke ich das Fermi besser sein wird als ATI, die Frage ist dann natürlich wieder, wieviel besser bei wieviel mehr Kosten. Im Endeffekt muss man natürlich abwarten bis die ersten Karten raus sind, was im schlimmsten Fall erst im April sein wird.
Kabelverknoter
24.01.2010 10:39
ich weiss gar nicht warum man denn überhaupt schon eine DX11 karte drin haben muss?! Wiviele spiele gibt es denn momentan mit DX11?! Und meint ihr nich das die karten demnächst mehr leistung haben werden wenn es mehr DX11 Spiele gibt?! und dann sitzt ihr auf euren "langsamen" karten....
ich spiel immernoch mit meiner Geforce 9800gx2 sowie einen q6600 und kann bis dato eh noch alle spiele auf 1600 x 1200 (CRT) flüssig spielen.
Wenn diese jahr noch so 4-5 titel mit DX11 rauskommen werd ich mal die berichte über dieleistung in den spielen der einzelnen Karten lesen bzw beobachten und kauf mir dann eine dx11 karte.