Nvidia A100 80GB GPU: Ampere-Server-Grafikkarte mit 80 GiByte HBM2e
Der Grafikkarten-Hersteller Nvidia hat einen neuen Chip auf Basis der Ampere-Architektur vorgestellt, der mit 80 Gigabyte Grafikspeicher daherkommt. Die A100 80GB GPU soll im Server-Bereich zum Einsatz kommen.
Nachdem Nvidia in diesem Jahr gleich drei neue Ampere-Grafikkarten für den Desktop-PC-Markt veröffentlicht hat, folgt nun der nächste Schritt im Bereich der Server. Hier offeriert das Unternehmen nun die A100 80 GB GPU, welche erstmals auf dem Speichertyp HBM2e setzt und gleich 80 Gigabyte VRAM verbaut hat. HBM2e erlaubt es Nvidia, doppelt so viel Speicher auf dem gleichen SXM4-Modul unterzubringen wie beim bisherigen A100 Tensor Core. Von dieser Menge an Speicher sollen vor allem KI-Algorithmen profitieren, sodass ein Algorithmus mit mehr Daten gefüttert und antrainiert werden kann.
Neuer HBM2e-Speicher mit mehr Speicher pro Stack
Der neue Speicher HBM2e ermöglicht es, bis zu acht übereinander gestapelte 16-Gbit-Chips in einem Speicherstack einzubauen und so bis zu 16 Gigabyte pro Stack offerieren zu können. Der neue Speicher wird aktuell von Samsung und SK Hynix gefertigt, wobei die beiden Zulieferer unterschiedliche Datenraten pro Pin angeben. Beim A100 80 GB GPU spricht Nvidia von mehr als zwei Terabyte pro Sekunde. Die fünf aktivierten Speicherstacks der Server-GPU können jeweils 410 GiB/s liefern.
Bildergalerie
Die "Vorgänger-GPU" A100 Tensor Core kommt auf eine TDP von 400 Watt, zumindest in der Version mit SXM4-Modul. Die PCIe-Karte mit dem gleichen GPU-Chip hingegen verbraucht nur 250 Watt. Die kontinuierlich abrufbare Leistung ist dafür bei der Variante als PCI-Express-Karte zwischen 10 bis 50 Prozent unterhalb des SXM4-Moduls angesiedelt, so Nvidia. Für den Desktop-PC sind sowieso derartige Server-Grafikkarten nicht gedacht. Allerdings zeigen sie durch den Einsatz von HBM2e einen Weg auf, wie das Problem mit dem zu geringen VRAM der Ampere-Grafikkarte RTX 3070 lösbar wäre. Ab dem ersten Quartal 2021 soll es von Partnern wie Atos, Dell, Fujitsu, Gigabyte, Hewlett Packard Enterprise oder Lenovo erste Server geben, die auf vier oder gar acht A100 80GB GPU setzen.
Ebenfalls lesenswert: Geforce RTX 3070 8 GB im Test: Spezial-Benchmarks visualisieren Speichermangel
Noch mehr News, Tests und Videos gibt's auch hier bei PCGH in der kostenlosen App von Google News.
Sammlung zur Ampere-Server-Grafikkarte A100 80GB GPU von Nvidia:
- Nvidia hat die Server-GPU namens A100 80 GB GPU vorgestellt, die auf Basis der Ampere-Architektur 80 Gigabyte HBM2e-Speicher bietet.
- Der neue Speicher ermöglicht es, bis zu acht übereinander gestapelte 16-Gbit-Chips in einem Speicherstack einzubauen und so bis zu 16 Gigabyte pro Stack offerieren zu können.
- Ab dem ersten Quartal 2021 soll es die ersten Server geben, die auf vier oder gar acht A100 80GB GPU setzen.
Quelle: Nvidia

.gif)
Da Produktion und Installation von HBM viele Fehlerquellen beinhaltet, würde ich aber auch (teilweise) belichtetes Silizium für möglich halten. Entweder, weil man fehlehrafte HBM-Stacks so als "Dummy" noch verkaufen kann, anstatt extra etwas anzufertigen, oder weil Nvidia keine Lust hat, einen A100, einen Interposer und vier/fünf funktionierende Stacks in den Müll zu schmeißen, nur weil ein funktionierender fünfter/sechster garantiert wird, bei dem aber etwas schief gelaufen ist. Eine Pacakge-Assemblierung hat letztlich genauso Yield-Raten wie alle anderen Fertigungsschritte und je nachdem, wie die aussehen, kann es günstiger sein zusätzliche Einheiten zu verbauen und dann zu deaktivieren als auf Kannte zu nähen und dann keine Reserven für Schäden zu haben.
(Theoretisch hat nVidia noch nach oben hin Luft um bis zu 144 GiB anzubieten.
[Ins Forum, um diesen Inhalt zu sehen]: Dazu kann man ohne Internas keine Ausage treffen. Für einen derart großen Chip könnte der Yield dennoch vergleichsweise gut sein. Mit seinen 826 mm2 bewegt er sich relativ nahe der Rectile-Größe des Scanners, was grundsätzlich zu schlechteren Yields führt. AMD hat bspw. in 7nm bisher nicht mal ansatzweise etwas derart Großes gefertigt.
Zur MI100 (CDNA) muss man noch abwarten, da noch keine Chipdetails vorliegen. Da hier aber auch weiterhin keine Tensor Core-Äquivalente implementiert sind, ist auch hier anzunehmen, dass auch dieser Chip kleiner sein wird ... darüber hinausgehend einmal mehr, weil AMD in diesem Punkt weitaus kostensensitiver als nVidia ist.
[Ins Forum, um diesen Inhalt zu sehen]: nVidia wird zweifellos keinen Ampere-Consumer-Refresh mit HBM2 veröffentlichen. nVidia hätte sich so einen "Spaß" bspw. beim GA102 kostentechnisch weitaus eher leisten können als AMD bei BigNavi und die haben es dennoch nicht getan und zudem obwohl es den großen Quadro's sicherlich gut zu Gesicht gestanden hätte. Da wird Mitte 2021 nichts derartiges kommen, übrigens ebensowenig wie bei AMD. Hier darf man als Consumer erst auf die Folgegenerationen hoffen, also Hopper und RDNA3 in 2022+. (Und btw, auch Intel setzt bei HPG (voraussichtlich im N6) auf GDDR6 ... wobei bei denen aber noch nicht ganz klar ist, ob die schon in 2021 im HighEnd mitspielen wollen.)