Online-Abo
Games World
  • Nvidia Geforce GTX 460 im Test: Die beste DirectX-11-Grafikkarte um 200 Euro?

    Gainward Geforce GTX 460 Golden Sample Goes Like Hell (1.024 MiByte) Quelle: PC Games Hardware

    Auf Basis des GF104-Chips schickt Nvidia zwei Modelle der Geforce GTX 460 ins Rennen, eines mit 768 MiByte und eines mit 1.024 MiByte Speicher. PC Games Hardware fühlt im Test beiden Varianten auf den Chip.

    [embhtml=33845]
    Jede bislang erhältliche Fermi-Grafikkarte basiert auf einem abgespeckten GF100-Chip, einen Vollausbau gibt es noch nicht. Das schnellste Modell ist die Geforce GTX 480, gefolgt von der Geforce GTX 470 (PCGH-Test). Die Geforce GTX 465 (PCGH-Test) stellt derzeit die gehobene Mittelklasse dar. All diesen Pixelbeschleunigern gemein ist eine hohe Leistungsaufnahme und Lautheit, denen ein großes Feature-Paket sowie die gute Lieferbarkeit inklusiver fairer Preise gegenüber stehen - die Geforce GTX 480 als schnellste Single-GPU-Karte am Markt ausgenommen. Mit dem GF104-Chip führt Nvidia nun eine Mittelklasse-GPU ins Feld (beispielsweise für World of Warcraft mit DirectX 11), welche ebenfalls nur in einer beschnittenen Version startet. Die darauf basierenden Karten hören auf den Namen Geforce GTX 460 und sind in zwei Versionen erhältlich. Der Test von PC Games Hardware klärt, ob Nvidia die bisherigen Schwächen der Fermi-Architektur beseitigt hat oder nicht.

    Veränderungen vom 'Panzer' GF100 zum 'Jäger' GF104 - das Blockdiagramm zur GTX 460 (eines der SMs ist in den beiden angekündigten Modellen deaktiviert).Veränderungen vom "Panzer" GF100 zum "Jäger" GF104 - das Blockdiagramm zur GTX 460 (eines der SMs ist in den beiden angekündigten Modellen deaktiviert).Quelle: NvidiaNvidias Geforce GTX 460 und GF104: Specs
    Wie bereits erwähnt tritt die Geforce GTX 460 Gerüchten zufolge nicht mit einem vollen GF104 an. Beide Kartenvarianten laufen mit 7 SIMDs (von Nvidia Shader-Multiprozessoren genannt; der bislang nicht verfügbare Vollausbau besitzt 8 SMs). Dies resultiert in 336 aktiven ALUs und 56 TMUs - letzteres entspricht (beinahe) einer Geforce GTX 470. Falls Sie sich jetzt wundern: Nvidia ändert mit dem GF104 das Verhältnis der ALUs zu den TMUs, genauer den Aufbau der Shader-Multiprozessoren: Jeder SM kommt auf 8 TMUs und 48 ALUs, das ist ein Verhältnis von 1:6. Der GF100 dagegen nutzt maximal 64 TMUs und 512 ALUs, was einem Verhältnis von 1:8 entspricht. Damit verfügt der GF104 über eine deutlich höhere Texelleistung im Verhältnis zu seinen GFLOPS. Das kommt vor allem älteren Spielen zugute, welche primär auf Textur-Operationen Wert legen, bringt jedoch auch in den meisten aktuellen Titeln mehr Bilder pro Sekunde und günstigeres AF. Bei 7 SMs stehen insgesamt nur 7 Polymorph-Engines bereit, halb so viele wie bei der Geforce GTX 470 und 4 weniger als bei der Geforce GTX 465. Nvidia gleicht dies zum Teil durch den Takt wieder aus: Die vorgegebenen 675 MHz Chip- und 1.350 MHz ALU-Takt entsprechen fast einer Geforce GTX 480.

    Wissenswert: Die wichtigsten Tests zur aktuellen Grafikkartengeneration von Nvidia und AMD

    Die Unterscheidung zwischen den beiden Geforce GTX 460 wird durch die ROPs erzielt. Die kleine Version ("GTX 460/768") setzt auf 24 dieser Endstufen, daraus resultiert ein 192 Bit breites Speicherinterface, das mit 768 MiByte GDDR5-RAM bestückt ist. Das größere Derivat ("GTX 460/1.024") kommt auf 32 ROPs und damit 256 Bit bei zeitgemäßen 1.024 MiByte. Da der GDDR5-Speicher bei beiden Varianten mit 1.800 MHz rechnet, bietet die 1G-Version theoretisch eine um 33 Prozent höhere Speicherbandbreite. Mit anderen Worten: Sie müssen den Speicher einer GTX 460/768 auf 2.400 MHz übertakten, um die Bandbreite einer GTX 460/1.024 zu erreichen. Im Vergleich zur Geforce GTX 465 verfügen beide GTX 460 über mehr GFLOPS und erreichen deutlich mehr GTex/s (Texturfüllrate), die Bandbreite liegt einmal über und einmal unter der GF100-Karte. In Sachen Bildqualität hat sich nichts geändert: Auch der GF104 bietet optionales High-Quality-AF, welches dem der Radeons überlegen ist, sowie vielfältig kombinierbares Sparse-Grid Supersampling-AA (SGSSAA) in allen APIs.

    Alle Spezifikationen der Geforce GTX 460 dokumentiert diese Tabelle:

    GrafikkarteGeforce   Radeon  
    ModellGTX 470GTX 465GTX 460/1GGTX 460/768HD 5850HD 5830HD 5770/1G
    Circa-Preis (Euro)300,-250,-230,-200,-270,-190,-140,-
    MarkteinführungMärz 2010Juni 2010Juli 2010Juli 2010September 2009Februar 2010Oktober 2009
    CodenameGF100GF100GF104GF104Cypress ProCypress LEJuniper XT
    Direct-X-/Shader-Version11/5.011/5.011/5.011/5.011/5.011/5.011/5.0
    Fertigungstechnik40 nm40 nm40 nm40 nm40 nm40 nm40 nm
    Transistoren Grafikchip (Mio.)3.0003.0001.9501.9502.1502.1501.040
    SP-Rechenleistung (GFLOPS)1.0898559079072.0881.7921.360
    DP-Rechenleistung (GFLOPS)16810776764183580
    Polygondurchsatz (Mio. Dreiecke/s.)2.4321.8241.3501.350725800850
    Pixeldurchsatz (GPix/s.)17,013,49,459,4523,212,813,6
    Texturleistung (GTex/s.)34,026,837,837,852,244,834,0
    Speicherbandbreite (GByte/s.)133,9102,7115,286,4128,0128,076,8
    Takt Grafikchip (Megahertz)608608675675725800850
    Takt Shader-ALUs (Megahertz)1.2151.2151.3501.350725800850
    Takt Videospeicher (Megahertz)1.6741.6041.8001.8002.0002.0002.400
    Datenrate Grafik-RAM (MBit/s.)3.3483.2083.6003.6004.0004.0004.800
    Shader-/SIMD-/Textureinheiten448/14/56352/11/44336/7/56336/7/561.440/18/721.120/14/56800/10/40
    Rasterendstufen40323224321616
    Speicheranbindung (Bit)320256256192256256128
    Übliche Speichermenge1.280 MiByte1.024 MiByte1.024 MiByte768 MiByte1.024 MiByte1.024 MiByte1.024 MiByte
    Üblicher SpeichertypGDDR5GDDR5GDDR5GDDR5GDDR5GDDR5GDDR5
    PCI-E.-Stromanschluss (Netzteil)2x 6-polig2x 6-polig2x 6-polig2x 6-polig2x 6-polig2x 6-polig1x 6-polig
    Leistungsaufnahme (TDP, lt. Hst.)215 Watt200 Watt160 Watt150 Watt170175108


    Technik-Details I: TMUs
    Auf Nachfrage bestätigte Nvidia einige unserer Vermutungen, die unsere Testprogramme nahhelegten. Die Textureinheiten wurden nicht nur anders zusammengefasst, sondern auch gründlich überarbeitet. Waren Nvidia-TMUs bis einschließlich GF100 bei einigen Formaten wie RGB9E5, FP10 oder FP16 auf halben Durchsatz beschränkt, sind die GF104-Texturierer nun FP16-Fullspeed-TMUs. Nicht nur beherrschen Sie, wie aktuelle Radeon-Karten auch, die o.g. Formate RGB9E5 und "FP10" (RGBA1010102) mit voller Geschwindigkeit, auch der für HDR-Rendering wichtige FP16-Format nötigt ihnen keine Extrarunde mehr ab.

    Das hohe Niveau der anisotropen Texturfilterung hat Nvidia beibehalten, auch der Fps-Verlust für die höhere Bildqualität blieb im Rahmen der Messgenauigkeit in unseren synthetischen Tests identisch.

    Technik-Details II: Geometrie und Tessellation
    Die beiden GPCs mit ihren Rasterizern sind theoretisch in der Lage, zwei Dreiecke pro Takt zu verarbeiten - herkömmliche Grafikkarten schaffen nur maximal eines, GTX470/480 vier und GT 465 bis zu drei. Wie schon beim GF100 räumt Nvidia freimütig ein, dass dieser Wert praktisch nicht erreicht werden kann - wir haben dem GF104 in unseren Tests maximal 1,5 Dreiecke pro Takt entlocken können. Insgesamt waren so knapp über einer Milliarde Polygone pro Sekunde drin - wichtig unter anderem für DirectX 11 Tessellation.

    Die Neuerungen innerhalb eines Shader-Multiprozessors: 3x 16 ALUs, 1x 16 L/S, 1x 8 TMUs, 1x 8 SFUs.Die Neuerungen innerhalb eines Shader-Multiprozessors: 3x 16 ALUs, 1x 16 L/S, 1x 8 TMUs, 1x 8 SFUs.Quelle: NvidiaTechnik-Details III: Der neue Verteiler
    Wie oben bereits erwähnt, wurden die Shader-Multiprozessoren gründlich überarbeitet. Die Dual-Warp-Scheduler, die den Ausführungseinheiten ihre Arbeit zuweisen, können nun zwei Instruktionen pro Takt loswerden. Insgesamt können die sieben Gruppen an Ausführungseinheiten (3x 16er-ALU, 1x 8er-TMU, 1x 16er-Load/Store, 1x 8er-SFU und einmal Texturinterpolation (Teil der SFU)) nun also mit vier Anweisungen gefüttert werden. Dabei macht man sich ein Verfahren zunutze, welches bereits früher zum Einsatz kam: Die Scheduler versorgen die ALUs "superskalar". Sind zwei aufeinander folgende Instruktionen unabhängig voneinander, kann der Scheduler diese zusammen absetzen; besteht eine Abhängigkeit, halbiert sich die "Issue Rate". Das zumindest legen Ergebnisse unserer synthetischen Tests nahe.

    a+b+c+d kann unabhängig in a+b, c+d und die Summe der Ergebnisse aufgespalten werden.
    a-b:c dagegen muss seriell gerechnet werden: Erst b:c und das Ergebnis wird von a abgezogen.

    Im besten Falle erreicht man so den doppelten Durchsatz und kann alle ALUs auslasten. Sind die Instruktionen abhängig voneinander, kann jeder Scheduler lediglich zwei Instruktionsblöcke pro Takt absetzen und so nur 32 der 48 Cuda-Kerne pro SM nutzen. Der Durchsatz entspräche dann einem Chip mit 224 Shader-ALUs.

    Technik-Details IV: "Flaschenhälse"
    Irgendwo musste Nvidia zwangsläufig den Rotstift ansetzen, um die rund 1 Milliarde Transistoren gegenüber dem GF100 einzusparen. Unter anderem fiel die hohe Gleitkommaleistung mit doppelter Genauigkeit (Double Precision, DP), über welche der GF100 prinzipiell verfügt, den Sparmaßnahmen bzw. der Fokussierung auf Gamer zum Opfer. Beschränkte Nvidia die Geforce-Karten GTX 465 bis 480 noch künstlich von 50% DP-Leistung gegenüber einfacher Genaugkeit auf ein Achtel, fällt der Schnitt beim GF104 drastischer aus: Nur noch eine der drei 16-breiten ALU-Gruppen beherrscht laut überhaupt DP und das auch nur mit 25% der SP-Geschwindigkeit. Insgesamt kommt man damit auf ein Zwölftel der für den wissenschaftlich-technischen Bereich interessanten DP-Leistung über den gesamten Chip.

    Außerdem arbeitet auch der GF104-Chip wie schon der GF100 an zwei Pixeln pro SM und Takt. Multipliziert ergibt das einen maximalen Durchsatz von 9.450 MPixeln pro Sekunde - synthetische Füllratentest fallen entsprechend gering aus, die Spieleleistung wird, wie unsere Tests zeigen, davon aber kaum beeinträchtigt. Mit maximal 128 Z-/Stenciloperationen (bei komprimierbaren Daten) pro Takt setzt der GF104 in diesem Bereich nur halb soviel durch wie der GF100, obwohl bei beiden die Rasterendstufen mehr Reserven bieten - das kommt dem Fps-Verlust mit aktiver Kantenglättung zugute, der ausgehend von der geringeren Rohleistung, weniger stark ausfällt.

    Informationen zu allen älteren Grafikchips entnehmen Sie unseren ausführlichen Tests:
    Geforce GTX 465
    Geforce GTX 470 und GTX 480
    AMD/Ati Radeon HD 5770/5750
    AMD/Ati Radeon HD 5830
    AMD/Ati Radeon HD 5850/5870
    AMD/Ati Radeon HD 5870/5850 Crossfire vs. Geforce GTX 285 SLI

    Wissenswert: Mehr Informationen zum Thema finden Sie in:
    Grafikkarten-Rangliste 2016: 32 Radeon- und Geforce-GPUs im Benchmarkvergleich [Oktober]
  • Stellenmarkt

    Es gibt 338 Kommentare zum Artikel
    Von buzz243
    vielleicht etwas spaet: ich hatte ne 285gtx/1gb OC von bfg und kann nur sagen in den hoeheren aufloesungen, 1600 und…
    Von prejudica
    sorry für die (evtl.) dumme frage aber...hat ??? die GTX 460 jetzt nen audio chip oder nicht???ich werd bei nvidia…
    Von PCGH_Marc
    Kaum, solange kein SpeedUp per DX11 im Spiel ist.
    Von stimpi2k4
    was ist denn mit der 285gtx?? würde gerne wissen ob die 460gtx deutlich mehr Leistung hat
    Von PCGH_Marc
    GTX 460 mit 2G und auch GTA4-Werte haben wir im Heft
  • Print / Abo
    Apps
    PC Games Hardware 09/2016 PC Games 10/2016 PC Games MMore 10/2016 play³ 10/2016 Games Aktuell 10/2016 buffed 10/2016 XBG Games 09/2016
    PCGH Magazin 09/2016 PC Games 10/2016 PC Games MMORE Computec Kiosk On the Run! Birdies Run
article
763639
Grafikkarten
Fermi-Mittelklasse auf dem Prüfstand
Auf Basis des GF104-Chips schickt Nvidia zwei Modelle der Geforce GTX 460 ins Rennen, eines mit 768 MiByte und eines mit 1.024 MiByte Speicher. PC Games Hardware fühlt im Test beiden Varianten auf den Chip.
http://www.pcgameshardware.de/Grafikkarten-Grafikkarte-97980/Tests/Fermi-Mittelklasse-auf-dem-Pruefstand-763639/
12.07.2010
http://www.pcgameshardware.de/screenshots/medium/2010/07/GXT460-CustomDesigns-01_b2teaser_169.jpg
fermi,radeon
tests