Nvidia Cuda 6 offiziell vorgestellt: Unified Memory, Drop-in Libraries und Multi-GPU-Scaling

News 18.11.2013 um 09:30 Uhr Mark Mantel Als bevorzugte Quelle auf Google hinzufügen

Grafikkartenhersteller Nvidia hat seine 06. Cuda-Version in einer Pressemitteilung angekündigt, welche die parallele Programmierung deutlich steigern soll. Dies soll durch Bibliotheken geschehen, welche nunmehr von der GPU statt CPU berechnet werden. Außerdem erhalten Applikationen Zugriff auf beide Speicher.

Schon Mitte Oktober hatten wir im Geforce-331.40-Treiber die versteckte Unterstützung von Cuda 6.0.1 entdeckt, in dem auch die Performance mit OpenCL teils deutlich angestiegen ist. Allerdings konnten wir Nvidia zu keiner offiziellen Aussage bezüglich der neuen Cuda-Version bewegen, da von dieser Seite nur die Rede von Cuda 5.5 war. Einen Monat später folgt nun die offizielle "Ankündigung" der überarbeiteten GPU-Schnittstelle - die Anführungsstriche deshalb, da Cuda 6 bereits in den Treibern integriert ist.

Neu eingeführt worden ist der Unified Memory, durch den Applikationen Zugriff auf den Speicher von CPU und GPU erhalten, ohne manuell die Daten jeweils hin und her kopieren zu müssen. Die Drop-in Libraries ersetzen die vorhanden CPU-Bibliotheken mit GPU-Varianten, wodurch die Berechnungen mit Fastest Fourier Transform in the West (FFTW) sowie Basic Linear Algebra Subprograms (BLAS) bis zu acht Mal schneller ablaufen sollen.

Die genannten Bibliotheken sollen damit auch über bis zu acht Grafikchips in einem Single Node skalieren können. Nvidia spricht von über 9 TFLOPS Double-Precision-Leistung pro Node, wobei die Workloads jetzt bis zu 512 GB groß sein dürfen. Insgesamt soll der Aufwand und die erforderliche Zeit für die Beschleunigung von wissenschaftlichen und konstruktionstechnischen Anwendungen, Enterprise-Applikationen sowie sonstigen Anwendungen für GPUs reduziert werden.

Quelle: Nvidia

Artikel teilen

Per E-Mail versenden

- Kommentare (12)
  Zur Diskussion im Forum
  
  Von Skysnake Lötkolbengott/-göttin
  
  Kanst du so nicht sagen.
  
  Es triffts eher so:
  Für Leute, die schnelle GPGPU-Umsetzungen/Beschleunigung von bestehendem Code haben wollen ist es interessant. Damit reagiert man vor allem auf Intel mit XeonPhi.
  
  Zitat von TheGoodBadWeird
  
  Primär vereinfacht es die Programmierung für GPGPU-Anwendungen um ein Vielfaches. Es kostet nur evtl. minimal Performance für die automatische Übergabe des Memory-Managements, aber die Entwickler sparen viel Zeit und Aufwand.
  
  Um ein Vielfaches ist übertrieben. Wenn man weiß, was man machen muss, ist es jetzt nichts, was einem um den Verstand bringt, sondern eher lästig ist. (Unified mem) Vor allem wäre ich aber SEHR vorsichtig bzgl Performanceaussagen. Das hängt immer ganz davon ab, was man denn macht. Man kann da auch schnell mal hohe zweistellige Prozentwerte an Performance verlieren je nach Problem. Da muss man schon aufpassen.
  
  Die Drop-in Libs sind da schon eher interressant. Sie sind aber halt "nur" ein 1:1 Replacement. Das ist vor allem für Leute interessant, die bereits bestehenden CPU-Code haben. Wie performant das Replacement ist, muss sich aber auch noch zeigen. Sooo einfach ist das ja auch nicht. Die Probleme müssen ja groß genug sein, damit man überhaupt erstmal den PCI-E Overhead kompensieren kann. Wie immer bei der Arbeit mit dGPUs muss man daher sehr genau schauen, was man macht.
  
  Ob die Änderungen auch auf Spiel zutreffen ist bisher unklar. Ich kann mir aber gut vorstellen, dass Teile davon stark in die neuen PhysX-Effekte integriert werden können.
  Theoretisch kann man das in PhysX an sich implementieren. Neue Effekte wird es deswegen aber nicht geben! Man erhält nämlich an sich nichts, was nicht vorher auch schon ging. Man macht es den Anwendern nur etwas leichter die Sachen zu nutzen. Am PhysX Code an sich hat aber eh nur nVidia rumgespielt. Von daher ziemlich uninteressant. Zumal die eben die performanteste Implementierung wählen, und nicht die "Quick and Dirty"-Variante
  
  Zitat
  
  Anders als AMD muss sich Nvidia dank des kürzlich vorgestellten G-Sync nicht all zu viele Gedanken um FPS machen. Solange die Voraussetzungen dafür erfüllt sind
  -GPU mit Kepler oder besser
  -G-Sync-Monitor
  -Framerate > 30 FPS
  Ist Nvidia wahrscheinlich immer besser aufgestellt.
  
  Ähm... ja....
  
  Es hat ja auch JEDER mit nVidia GPU nen G-Sync Monitor
  G-Sync Monitore kosten aufgrund mehr Hardware ja auch nicht mehr Geld
  und G-Sync kommt ja auch gar nicht erst Ende 2014...
  
  Zitat
  
  Prinzipiell funktionieren die meisten Features von CUDA 6 auch auf Kepler, sonst würde Nvidia nicht mit ihrer Quadro K6000 werben. Was Allerdings nicht möglich wäre, ist dassn ein paar wichtige Implementierungen das Memory-Menagements mit alten Karten nicht funktioneren. Dies wird erst mit Maxwell eingeführt. Die neuen Karten enthalten dann die benötigte "Unified Memory"-Architektur.
  
  Dann sag mal was die "unified Memory-Architektur" denn so ist, und was Kepler/Fermi denn nicht haben....
  
  Zitat
  
  Die neuen Features von PhysX wie FlexWorks, Fire-/Smoke-Works sowie GI-Works laufen aber sicherlich auch auf älteren Karten.
  
  Natürlich tun Sie das.
  
  Zitat
  
  Anders als Skysnake vermutet hat Nvidia noch nie Funktionen von CUDA zurück gehalten. Nur wegen CUDA würde niemand neue Karten kaufen. Das ist eher ein Spezialgebiet von Microsoft. Die machen so etwas gerne wie man nur all zu gut weiß
  
  Sorry, aber du hast keine Ahnung was den GPGPU-Bereich anbelangt... Und insbesondere nicht, was nVidia anbelangt... nVidia verkauft natürlich über neue CUDA-Versionen neue Hardware. Allein das GPU-Direct2 nicht auf Fermi läuft wird so manche Karte verkauft haben.
  
  Zitat
  
  Das kommt darauf an. Wenn ich mich nicht irre, greifen Geforce Experience und somit Shadowplay (Streaming) auf CUDA zurück. Das muss sich aber erst noch herausstellen. Bisher ist CUDA vorallem für die wissenschaftlichen Anwendungen interessant.
  
  Das hat aber an sich nichts mit Grafik zu tun, und dem was der Normalanwender von CUDA sieht. Das sind Details in den Treiberuntiefen. Natürlich verwendet man da Sachen wieder, aber da kommt man als "normaler" Entwickler gar nicht dran, weil nVidia da total panisch rumeiert mit ihrem Sourcecode...
  
  CUDA hat zwar ein paar Schnittstellen zu OpenGL/DX, aber an sich hat CUDA nichts aber auch rein gar nichts! mit Grafik zu tun. Man kann Berechnungen durchführen, die man auch in der Grafikpipeline verwendet, aber das wars dann auch.
  
  Zitieren
  
  Von Skysnake Lötkolbengott/-göttin
  
  Kanst du so nicht sagen.
  
  Es triffts eher so:
  Für Leute, die schnelle GPGPU-Umsetzungen/Beschleunigung von bestehendem Code haben wollen ist es interessant. Damit reagiert man vor allem auf Intel mit XeonPhi.
  
  Zitat von TheGoodBadWeird
  
  Primär vereinfacht es die Programmierung für GPGPU-Anwendungen um ein Vielfaches. Es kostet nur evtl. minimal Performance für die automatische Übergabe des Memory-Managements, aber die Entwickler sparen viel Zeit und Aufwand.
  
  Um ein Vielfaches ist übertrieben. Wenn man weiß, was man machen muss, ist es jetzt nichts, was einem um den Verstand bringt, sondern eher lästig ist. (Unified mem) Vor allem wäre ich aber SEHR vorsichtig bzgl Performanceaussagen. Das hängt immer ganz davon ab, was man denn macht. Man kann da auch schnell mal hohe zweistellige Prozentwerte an Performance verlieren je nach Problem. Da muss man schon aufpassen.
  
  Die Drop-in Libs sind da schon eher interressant. Sie sind aber halt "nur" ein 1:1 Replacement. Das ist vor allem für Leute interessant, die bereits bestehenden CPU-Code haben. Wie performant das Replacement ist, muss sich aber auch noch zeigen. Sooo einfach ist das ja auch nicht. Die Probleme müssen ja groß genug sein, damit man überhaupt erstmal den PCI-E Overhead kompensieren kann. Wie immer bei der Arbeit mit dGPUs muss man daher sehr genau schauen, was man macht.
  
  Ob die Änderungen auch auf Spiel zutreffen ist bisher unklar. Ich kann mir aber gut vorstellen, dass Teile davon stark in die neuen PhysX-Effekte integriert werden können.
  Theoretisch kann man das in PhysX an sich implementieren. Neue Effekte wird es deswegen aber nicht geben! Man erhält nämlich an sich nichts, was nicht vorher auch schon ging. Man macht es den Anwendern nur etwas leichter die Sachen zu nutzen. Am PhysX Code an sich hat aber eh nur nVidia rumgespielt. Von daher ziemlich uninteressant. Zumal die eben die performanteste Implementierung wählen, und nicht die "Quick and Dirty"-Variante
  
  Zitat
  
  Anders als AMD muss sich Nvidia dank des kürzlich vorgestellten G-Sync nicht all zu viele Gedanken um FPS machen. Solange die Voraussetzungen dafür erfüllt sind
  -GPU mit Kepler oder besser
  -G-Sync-Monitor
  -Framerate > 30 FPS
  Ist Nvidia wahrscheinlich immer besser aufgestellt.
  
  Ähm... ja....
  
  Es hat ja auch JEDER mit nVidia GPU nen G-Sync Monitor
  G-Sync Monitore kosten aufgrund mehr Hardware ja auch nicht mehr Geld
  und G-Sync kommt ja auch gar nicht erst Ende 2014...
  
  Zitat
  
  Prinzipiell funktionieren die meisten Features von CUDA 6 auch auf Kepler, sonst würde Nvidia nicht mit ihrer Quadro K6000 werben. Was Allerdings nicht möglich wäre, ist dassn ein paar wichtige Implementierungen das Memory-Menagements mit alten Karten nicht funktioneren. Dies wird erst mit Maxwell eingeführt. Die neuen Karten enthalten dann die benötigte "Unified Memory"-Architektur.
  
  Dann sag mal was die "unified Memory-Architektur" denn so ist, und was Kepler/Fermi denn nicht haben....
  
  Zitat
  
  Die neuen Features von PhysX wie FlexWorks, Fire-/Smoke-Works sowie GI-Works laufen aber sicherlich auch auf älteren Karten.
  
  Natürlich tun Sie das.
  
  Zitat
  
  Anders als Skysnake vermutet hat Nvidia noch nie Funktionen von CUDA zurück gehalten. Nur wegen CUDA würde niemand neue Karten kaufen. Das ist eher ein Spezialgebiet von Microsoft. Die machen so etwas gerne wie man nur all zu gut weiß
  
  Sorry, aber du hast keine Ahnung was den GPGPU-Bereich anbelangt... Und insbesondere nicht, was nVidia anbelangt... nVidia verkauft natürlich über neue CUDA-Versionen neue Hardware. Allein das GPU-Direct2 nicht auf Fermi läuft wird so manche Karte verkauft haben.
  
  Zitat
  
  Das kommt darauf an. Wenn ich mich nicht irre, greifen Geforce Experience und somit Shadowplay (Streaming) auf CUDA zurück. Das muss sich aber erst noch herausstellen. Bisher ist CUDA vorallem für die wissenschaftlichen Anwendungen interessant.
  
  Das hat aber an sich nichts mit Grafik zu tun, und dem was der Normalanwender von CUDA sieht. Das sind Details in den Treiberuntiefen. Natürlich verwendet man da Sachen wieder, aber da kommt man als "normaler" Entwickler gar nicht dran, weil nVidia da total panisch rumeiert mit ihrem Sourcecode...
  
  CUDA hat zwar ein paar Schnittstellen zu OpenGL/DX, aber an sich hat CUDA nichts aber auch rein gar nichts! mit Grafik zu tun. Man kann Berechnungen durchführen, die man auch in der Grafikpipeline verwendet, aber das wars dann auch.
  
  Zitieren
  
  Von Gast1655586602
  
  Zitat von KrHome
  
  3dfx ist ganz sicher nicht wegen eines API-Krieges pleite gegangen. Die haben chiptechnisch spätestens mit der Veröffentlichung der Voodoo 3 den Anschluss an die Konkurrenz (Nvidia) verloren und nie wieder aufgeholt. Mit Glide hatte das wenig zu tun.
  
  Missmanagement war sicher einer der Hauptgründe, jedoch war es auch nicht hilfreich, dass die Entwickler Glide den Rücken zugekehrt haben und zu DirectX gewechselt sind. 3dfx hat sich an vielen Stellen einfach verhoben und ist daran zugrunde gegangen.
  
  Vergleich doch einmal die Geschäftszahlen von Nvidia. Die sind grundsolide und das über einen längeren Zeitraum. Dazu haben sie ihren Fuß tief im GPGPU-Bereich. Der Gamingsektor läuft ebenfalls hervorragend. Die Expertise ist sichtlich vorhanden... bei AMD sieht das völlig anders aus.
  
  Lass uns aber nicht so tief hierauf eingehen und kurz sagen:
  -Für Leute mit GPU-Programmierung ist dieses CUDA-Update enorm sinnvoll!
  
  Zitieren
  
  Von KrHome
  
  Zitat von TheGoodBadWeird
  
  Der letzte API-War hat unter anderem 3dfx in den Ruin getrieben. Das möchte ich weder für AMD noch Nvidia erleben!
  
  3dfx ist ganz sicher nicht wegen eines API-Krieges pleite gegangen. Die haben chiptechnisch spätestens mit der Veröffentlichung der Voodoo 3 den Anschluss an die Konkurrenz (Nvidia) verloren und nie wieder aufgeholt. Mit Glide hatte das wenig zu tun.
  
  Zitieren
  
  Von Gast1655586602
  
  Zitat von DieLutteR
  
  Also das hört sich für mich, auf den ersten Blick, nach einem Konter zu Mantle an.
  
  Nein!
  -Das ist die Vorbereitung auf Maxwell und schon seit Ewigkeiten angekündigt. Damals gab es von Mantle noch nicht einmal Gerüchte. Nvidia wird Mantle außerdem nicht kontern, weil sie viele ähnliche Funktionen in CUDA einbauen werden. Wir brauchen alles aber keinen neuen API-Krieg.
  
  Der letzte API-War hat unter anderem 3dfx in den Ruin getrieben. Das möchte ich weder für AMD noch Nvidia erleben!
  
  Zitat von DieLutteR
  
  Nur wird im Artikel vorwiegend von professionellen Anwendungen geredet:
  Ist zu erwarten, dass diese Änderungen auch in Spielen greifen und für mehr fps sorgen?!
  
  Primär vereinfacht es die Programmierung für GPGPU-Anwendungen um ein Vielfaches. Es kostet nur evtl. minimal Performance für die automatische Übergabe des Memory-Managements, aber die Entwickler sparen viel Zeit und Aufwand.
  
  Ob die Änderungen auch auf Spiel zutreffen ist bisher unklar. Ich kann mir aber gut vorstellen, dass Teile davon stark in die neuen PhysX-Effekte integriert werden können.
  
  Anders als AMD muss sich Nvidia dank des kürzlich vorgestellten G-Sync nicht all zu viele Gedanken um FPS machen. Solange die Voraussetzungen dafür erfüllt sind
  -GPU mit Kepler oder besser
  -G-Sync-Monitor
  -Framerate > 30 FPS
  Ist Nvidia wahrscheinlich immer besser aufgestellt.
  
  Zitat von schlumpi13
  
  funktioniert cuda 6 auch auf kepler oder muss ich dafür wieder ne neue gpu kaufen ?
  
  Zitat von Skysnake
  
  Kepler an sich wird das können. Wahrscheinlich sogar Fermi, die Frage ist da eher ob nVidia das auch will. Neue CUDA-Versionen verkaufen ja schließlich auch Karten...
  
  Prinzipiell funktionieren die meisten Features von CUDA 6 auch auf Kepler, sonst würde Nvidia nicht mit ihrer Quadro K6000 werben. Was Allerdings nicht möglich wäre, ist dassn ein paar wichtige Implementierungen das Memory-Menagements mit alten Karten nicht funktioneren. Dies wird erst mit Maxwell eingeführt. Die neuen Karten enthalten dann die benötigte "Unified Memory"-Architektur.
  
  Die neuen Features von PhysX wie FlexWorks, Fire-/Smoke-Works sowie GI-Works laufen aber sicherlich auch auf älteren Karten.
  
  Anders als Skysnake vermutet hat Nvidia noch nie Funktionen von CUDA zurück gehalten. Nur wegen CUDA würde niemand neue Karten kaufen. Das ist eher ein Spezialgebiet von Microsoft. Die machen so etwas gerne wie man nur all zu gut weiß
  
  Zitat von Skysnake
  
  Nein, in Spielen nutzt man kein CUDA.
  
  Das kommt darauf an. Wenn ich mich nicht irre, greifen Geforce Experience und somit Shadowplay (Streaming) auf CUDA zurück. Das muss sich aber erst noch herausstellen. Bisher ist CUDA vorallem für die wissenschaftlichen Anwendungen interessant.
  
  Zitieren
  
  Von Skysnake Lötkolbengott/-göttin
  
  Zitat von DieLutteR
  
  Also das hört sich für mich, auf den ersten Blick, nach einem Konter zu Mantle an.
  Nur wird im Artikel vorwiegend von professionellen Anwendungen geredet:
  Ist zu erwarten, dass diese Änderungen auch in Spielen greifen und für mehr fps sorgen?!
  
  Nein, in Spielen nutzt man kein CUDA.
  
  Zitat von schlumpi13
  
  funktioniert cuda 6 auch auf kepler oder muss ich dafür wieder ne neue gpu kaufen ?
  
  Frag nVidia.
  
  Kepler an sich wird das können. Wahrscheinlich sogar Fermi, die Frage ist da eher ob nVidia das auch will. Neue CUDA-Versionen verkaufen ja schließlich auch Karten...
  
  Zitieren
  
  Direkt zum Diskussionsende

Hoch

Print / Abo

Apps

Die Redaktion Datenschutz Artikel-Archiv Datenschutz-Optionen Mediadaten Impressum Utiq verwalten Abo kündigen AGB Inhalt melden Newsletter

Artikel teilen

Kommentare (12)