Geforce GTX 1660 Ti im Test: Turing-Effizienz ohne Raytracing und DLSS ab 299 Euro

Mit der Geforce GTX 1660 Ti bringt Nvidia seine Turing-Architektur in den sehr gefragten Preisbereich ab 300 Euro. Aus Kostengründen fallen dafür jedoch die Spezialfunktionen rund um Raytracing und das KI-Anti-Aliasing DLSS dem Rotstift zum Opfer - die übrigen Errungenschaften Turings bleiben jedoch bestehen. Im Test der Geforce GTX 1660 Ti klärt PC Games Hardware, ob die Rechnung aufgeht.

510

Test 22.02.2019 um 15:00 Uhr Raffael Vötter Mark Mantel Als bevorzugte Quelle auf Google hinzufügen

Quelle: PC Games Hardware

Auf dieser Seite

1 Geforce GTX 1660 Ti im Test: Spezifikationen und Vergleich zur GTX 1060

Die Gerüchteküche sollte im Falle der Geforce GTX 1660 Ti Recht behalten. Denn so und nicht anders nennt Nvidia seinen bislang kleinsten Turing-Ableger, der mit GTX- statt RTX-Suffix und ohne dedizierte Schaltkreise zur Beschleunigung von Raytracing auskommen muss. Bereits im Falle der Geforce RTX 2060 ist die Raytracing-Geschwindigkeit grenzwertig gering, sodass es kaum Sinn ergäbe, einen noch kleineren Grafikchip mit der Funktionalität auszustatten und dafür Siliziumfläche zu opfern. Gesagt, getan: Die Geforce GTX 1660 Ti basiert auf einem Turing-Kern ohne RT- und Tensor-Kerne und verspricht somit hohe Effizienz zum schmalen Preis. Nvidias Zielgruppe sind Nutzer älterer Mittelklasse-Grafikkarten wie der Geforce GTX 960 und Radeon R9 380. Ihnen verspricht man (bis zu) den Leistungsfaktor 3. Was die Geforce GTX 1660 Ti tatsächlich kann - und was nicht -, erfahren Sie im ausführlichen PCGH-Test der GTX 1660 Ti.

Für Interessíerte haben wir die komplette Nvidia-Präsentation der Geforce GTX 1660 Ti in die Bildergalerie gepackt (ab Bild 5). Zum Einstand empfehlen wir Ihnen unser Praxisvideo zur neuen Nvidia-Grafikkarte:

Geforce GTX 1660 Ti im Test: Spezifikationen und Vergleich zur GTX 1060

Bei der Geforce GTX 1660 Ti kommt die neue TU116-GPU als Nachfolger des GP106 (Pascal) zum Einsatz. Diese besteht aus 24 Shader-Multiprozessoren (SMs) mit 1.536 Shader-ALUs, 96 Textureinheiten (TMUs) und 48 Raster-Endstufen (ROPs). Speicherseitig ist das Interface mit GDDR6-Unterstützung 192 Bit breit. Die TU116-GPU bringt 6,6 Milliarden Transistoren auf einer Chipfläche von 284 mm² unter, wobei TSMCs optimierter 16-nm-Prozess 12FFN zum Einsatz kommt. Laut Nvidias Blockdiagramm, der die komplette TU116-GPU visualisieren soll, kommt bei der Geforce GTX 1660 Ti der Vollausbau und keine abgespeckte Variante zum Einsatz. Auch eine Unterscheidung zwischen A- und Non-A-GPU gibt es bei der GTX 1660 Ti nicht.

Nach Demontage des Kühlers erblicken wir passend zum Blockdiagramm einen auffällig rechteckigen Grafikchip mit der genauen Kennung TU116-400-A1. Die "400" steht in Nvidias Nummerierungsschema für einen Vollausbau - die Titan RTX verwendet beispielsweise den TU102-400, ebenfalls in A1-Revision. Läge ein Beschnitt der Speicherschnittstelle vor, etwa weil der Kern eigentlich 256 Datenpfade besitzt, wäre dies in Form eines "Kx" vermerkt. Interessant ist, dass die von uns exemplarisch zerlegte Geforce GTX 1660 Ti eine Platine mit insgesamt acht Speicherplätzen verwendet, ergo für 8 GiByte vorbereitet ist. Eine GTX 1660 Ti mit dieser Kapazität ist nur mit Verrenkungen bei der Speicherbestückung möglich, weshalb wir eine andere Vermutung haben: Entsprechende PCBs sind auch zum Betrieb als GTX 1650 vorbereitet, welche gerüchteweise über 4 GiByte an 128 Bit verfügen wird und im März starten soll.

Modell	RTX 2060 FE	GTX 1660 Ti	GTX 1080	GTX 1070	GTX 1060/6G	RX Vega 56
Codename/Konfektion	TU106-200A-KA	TU116-400	GP104-400	GP104-200	GP106-400	Vega 10 XL
Name der Achitektur	Turing	Turing	Pascal	Pascal	Pascal	Vega
Chipgröße (reiner Die)	445 mm²	284 mm²	314 mm²	314 mm²	200 mm²	486 mm²
Transistoren Grafikchip (Mio.)	10.800	6.600	7.200	7.200	4.400	12.500
Fertigungsverfahren	12 nm FFN	12 nm FFN	16 nm FF+	16 nm FF+	16 nm FF+	14LPP (FinFET)
Shader-/SIMD-/Textureinheiten	1.920/30/120	1.536/24/96	2.560/20/160	1.920/15/120	1.280/10/80	3.584/64/224
Tensor-Kerne	240	-	-	-	-	-
Raytracing-Kerne	30	-	-	-	-	-
Raster-Endstufen (ROPs)	48	48	64	64	48	64
GPU-Basistakt (MHz)	1.365	1.500	1.607	1.506	1.506	1.156
GPU-Boost-Takt (MHz)	1.680	1.770	1.733	1.683	1.708	1.471
FP32/FP64-Leistung (TFLOPS)*	6,45/0,20	5,44/0,17	8,87/0,28	6,46/0,20	4,37/0,14	10,54/0,66
Größe des Level-2-Caches (KiB)	3.072	1.536	2.048	2.048	1.536	4.096
Speicheranbindung (Bit)	192	192	256	256	192	4.096
Geschwindigkeit RAM (GT/s)	14	12	10	8	8	1,6
Speichertyp	GDDR6	GDDR6	GDDR5X	GDDR5	GDDR5	HBM2
Speicherübertragung (GB/s)	336	288	320,4	256	192	410
Übliche Speichermenge (MiB)	6.144	6.144	8.192	8.192	6.144	8.192
PCI-Express-Stromanschlüsse	1 × 8-polig	1 × 8-polig	1 × 8-polig	1 × 8-polig	1 × 6-polig	2 × 8-polig
Typische Leistungsaufnahme	<160 Watt	<120 Watt	<180 Watt	<150 Watt	<120 Watt	<210 Watt

*Anhand der typischen Boost-Taktraten laut AMD und Nvidia. Die tatsächliche Frequenz schwankt.

Turing-Shader ohne Raytracing

Neben den Raytracing- fehlen dem Grafikchip auch die Tensor-Kerne, sodass die GTX 1660 Ti weder topmoderne Beleuchtung noch das KI-Anti-Aliasing DLSS berechnen kann. Nichtsdestotrotz hat Nvidia seinen Shader-Multiprozessor vielseitig umgebaut, um die Leistung pro SM und Takt gegenüber Pascal zu erhöhen. In den Mittelpunkt stellt Nvidia den gleichzeitigen Einsatz von FP32- und INT32-Shadern, welche bei Turing grundsätzlich parallel abgearbeitet werden können. Die Vorgänger-GPUs können nur eines von beiden, müssen also stets umschalten. Im Falle der Geforce GTX 1660 Ti spricht der Chiphersteller deshalb werbeträchtig von "11 TOPS" (Tera-Operationen pro Sekunde) theoretischer Rechenleistung - 5,5 TFLOPS FP32 und 5,5 TOPS INT32 (aufgerundet). In der Praxis kommt es auf den Game-Code an, wie sehr die Geforce GTX 1660 Ti und die großen Turing-Geschwister von den zusätzlichen Integer-Einheiten profitieren. Nähert sich ein Titel einer 50:50-Verteilung an, fällt der Geschwindigkeitsvorteil signifikant aus. Nvidia führt als Paradebeispiel Shadow of the Tomb Raider an: Von 100 Instruktionen sollen 62 FP32- und 38 INT32-Berechnungen darstellen, sodass sich die Geforce GTX 1660 Ti dort gut von der Geforce GTX 1060/6G absetzen kann. Die Kalifornier nennen ein Leistungsplus von 50 Prozent.
Quelle: Nvidia Geforce GTX 1660 Ti im Test: Turing-Effizienz ohne Raytracing und DLSS ab 299 Euro (4) Im Falle der Geforce RTX 2060 bis hinauf zur Titan RTX kümmern sich die Tensor-Kerne um die rasante Abarbeitung von FP16-Instruktionen. Diese fehlen dem TU116 der Geforce GTX 1660 Ti zwar, der Kern ist aber trotzdem in der Lage, FP16-Formate mit doppelter FP32-Geschwindigkeit abzuarbeiten - ohne dass dafür das NGX-Framework notwendig wäre. Nvidia betont außerdem, dass Turing über eine neue Cache-Struktur mit wesentlich größerem L1-Zwischenspeicher als Pascal verfügt, welcher die praktische Leistung pro SM erhöht. 1,5 MiByte des rasanten Caches stehen kernweit zur Verfügung, während der GP106 einer Geforce GTX 1060 noch mit 480 KiByte auskommen muss. Unverändert gegenüber dem GP106 bleibt dagegen der L2-Cache mit ebenfalls 1,5 MiByte Kapazität.

Blockdiagramme: TU106 (RTX 2070/2060) neben TU116 (GTX 1660 Ti)

TU116 TU106

Vollbild-Vergleich

TU106 Blockdiagramm Geforce RTX 2070/2060

Ein Wort zu den Chipgrößen: Die TU116-GPU mutet mit 6,6 Milliarden Transistoren auf 284 mm² vergleichsweise groß an. Das entspricht 50 Prozent mehr Transistoren auf 42 Prozent mehr Siliziumfläche (die Packdichte ist etwas gestiegen), während die Anzahl der FP32-Shader nur um 20 Prozent ansteigt und die Speicherschnittstelle bei 192 Bit verweilt. Vor allem die zusätzlichen INT32-Shader sowie der größere und schnellere L1-Cache, aber auch die Einheiten für FP16, INT8 sowie INT4 bauschen die GPU natürlich auf. Außerdem ist der TU116 in drei Graphics Processing Cluster (GPC) und nicht in zwei wie beim GP106 aufgeteilt, womit das Front-End stärker ausfällt. Die reinen FP32-Shader sollte man hier nicht stumpf eins zu eins gegenrechnen. Letztendlich sinkt die Leistung pro Flächeneinheit aber erst einmal, wenn man die Geforce GTX 1660 Ti mit der Geforce GTX 1080 oder 1070 vergleicht - das ändert sich erst, wenn Spiele die neuen Turing-Funktionen nutzen.

GDDR6-Speicher, aber mit 12 statt 14 GT/s

Die Geforce GTX 1660 Ti nutzt als erste Grafikkarte GDDR6-Speicher mit einer Übertragungsgeschwindigkeit von 12 Gigatransfers pro Sekunde (GT/s). Die Bandbreite gegenüber der Geforce GTX 1060/6G mit 8-Gbps-GDDR5-RAM steigt somit um 50 Prozent auf rund 288 GByte/s. Der eingesetzte Speicher ist interessant, weil Nvidia bisher ausschließlich auf 14-Gbps-Chips setzte. Wir haben den Kühler von einem Gigabyte-Testmuster abgenommen, auf dem Micron-Module mit der Kennzeichnung 8ZSA77 D9WCR verlötet sind. Der zweite Teil ist Microns FPGA-Code und führt zur entsprechenden Produktseite. Demnach gibt es den Speicher tatsächlich mit 12 Gbps. Der Speicher auf besagtem Muster ließ sich allerdings spielend auf 7.700 MHz (15,4 Gbps) übertakten, was eine Transferrate von knapp 370 GByte/s ergibt. Eine Garantie für eine solche Übertaktung gibt es mit 12-Gbps-Chips jedoch nicht.

Variable Rate Shading zur Senkung der Rechenlast

Neben den Anpassungen, welche die Leistung pro SM und Takt verbessern, spricht Nvidia bei der Geforce GTX 1660 Ti erneut das Thema Variable Rate Shading an, das sich in Content Adaptive Shading (teilweise Nvidia Adaptive Shading genannt) und Motion Adaptive Shading aufteilt. Der Sinn dahinter ist identisch: Turing-GPUs erkennen mit geeigneter Software-Unterstützung verschiedene Bildbereiche und können bei Bedarf die Shading-Präzision heruntersetzen, um Rechenleistung zu sparen - im Bestfall, ohne dass es auffällt. Die verringerte Präzision lässt sich zum Beispiel gut bei großen einheitlichen beziehungsweise gleich bleibenden Oberflächen oder bei schnellen Bewegungen am Bildrand einsetzen. Bisher stellt Wolfenstein 2 das einzige Spiel dar, das die clevere Technik nutzt. Daher ist dieser Turing-Vorteil bisher theoretischer Natur, könnte jedoch in kommenden Spielen (unter anderem Doom Eternal) weitere Verbreitung erfahren.