Stable Diffusion: AMD macht Radeon-Grafikkarten bis zu zehnmal so schnell - unter Windows

24
News Valentin Sattler Als bevorzugte Quelle auf Google hinzufügen
Stable Diffusion: AMD macht Radeon-Grafikkarten bis zu zehnmal so schnell - unter Windows
Quelle: AMD

AMD hat eine Anleitung veröffentlicht, mit der Stable Diffusion unter Windows bis zu zehnmal so schnell laufen soll wie bisher. Die Bestrebungen, Deep-Learning-Anwendungen unter Windows zu beschleunigen, und damit Nvidia Konkurrenz zu machen, tragen damit erste Früchte.

Generative AI-Modelle wie Stable Diffusion liefern zwar beeindruckende Ergebnisse, sie brauchen dafür aber sehr viel Rechenleistung. Meistens wird diese über Grafikkarten oder spezielle Beschleuniger bereitgestellt, doch hier kann es Probleme geben: AMD-Nutzer bleiben meistens außen vor, da viele Deep-Learning-Modelle nur CPUs und Nvidia-Grafikkarten unterstützten. Unter Linux gibt es dafür mit ROCm zwar schon länger eine Lösung, unter Windows musste man aber noch auf die CPU oder einen nur mäßigen GPU-Support setzen.

Stable Diffusion mit AMD Radeon

Gleichzeitig arbeitet AMD aber schon länger daran, auch für Windows gute Lösungen zu entwickeln. Eine davon wurde nun genauer vorgestellt: In einer von AMD veröffentlichten Anleitung wird beschrieben, wie Nutzer Stable Diffusion mit einer Radeon-Grafikkarte deutlich beschleunigen können. Konkret wird dabei die beliebte Webui von AUTOMATIC1111 genutzt.

AMD erklärt in der Anleitung, wie man das für Deep-Learning-Anwendungen gedachte Optimierungstool Microsoft Olive installiert und damit Stable Diffusion anpasst. Anschließend kann die Webui installiert und das optimierte Modell geladen werden. Durch die Verwendung der Microsoft-Schnittstelle DirectML und einige Anpassungen an der Software sollen sich so gigantische Leistungsvorteile ergeben. Auf einer AMD Radeon RX 7900 XTX spricht AMD von 18,59 Bildverbesserungs-Iterationen pro Sekunde, wohingegen es vorher nur 1,87 gewesen sein sollen.

Ebenso spannend: [PLUS] Wissen: Deep Learning - Die Grundlagen für DLSS, Stable Diffusion oder ChatGPT

Ob dieser Leistungssprung auch abseits von Herstellerbenchmarks anzutreffen ist, müssen unabhängige Tests dabei noch bestätigen. Falls die Performance aber tatsächlich auf diesem Niveau wäre, könnte AMD mit dem optimierten Pfad womöglich endlich zu Nvidia aufschließen. Zum Vergleich: Eine Geforce RTX 4080 schafft laut Wccftech 19,41 Iterationen pro Sekunde, sie ist gleichzeitig aber etwas teurer. Zudem bleibt die Inbetriebnahme mit Geforce-Grafikkarten wohl weiterhin einfacher, da dort keine zusätzliche Anpassung am Modell notwendig ist.

Quelle: AMD (Anleitung) via Wccftech

24
    • Kommentare (24)

      Zur Diskussion im Forum
      • Von mhjhjh Komplett-PC-Aufrüster(in)
        Zitat von JTRch
        Vielleicht kann mir jemand helfen, da ich keine Erfahrung mit Anaconda habe. Habe gestern alle Punkte durchgemacht, bin dann aber bei Punkt 5 hängen geblieben, weil mir das Prombt von Anaconda keine bat Dateien ausführt. Anscheinend kann man das irgendwie forcieren, aber darauf geht die Anleitung von AMD eben nicht ein.

        Mit meiner jetztigen Lösung (DirectML und einer zusätzlichen Prombt, denn ich nicht auswendig weiss) habe ich aber jetzt schon 4 bis 6 Iterationen pro Sekunde mit meiner 7900XTX.
        > Prerequisites

        Installed Anaconda/Miniconda (Miniconda for Windows)

        Ensure Anaconda/Miniconda directory is added to PATH


        Hast du diesen Punkt vielleicht nicht erfüllt? Bei der Installation von miniconda ist das keine Standardoption.
      • Von mhjhjh Komplett-PC-Aufrüster(in)
        Zitat von JTRch
        Vielleicht kann mir jemand helfen, da ich keine Erfahrung mit Anaconda habe. Habe gestern alle Punkte durchgemacht, bin dann aber bei Punkt 5 hängen geblieben, weil mir das Prombt von Anaconda keine bat Dateien ausführt. Anscheinend kann man das irgendwie forcieren, aber darauf geht die Anleitung von AMD eben nicht ein.

        Mit meiner jetztigen Lösung (DirectML und einer zusätzlichen Prombt, denn ich nicht auswendig weiss) habe ich aber jetzt schon 4 bis 6 Iterationen pro Sekunde mit meiner 7900XTX.
        > Prerequisites

        Installed Anaconda/Miniconda (Miniconda for Windows)

        Ensure Anaconda/Miniconda directory is added to PATH


        Hast du diesen Punkt vielleicht nicht erfüllt? Bei der Installation von miniconda ist das keine Standardoption.
      • Von Jaffech BIOS-Overclocker(in)
        Zitat von VanWayne
        Nvidia meldete letztens Verkaufserfolge mit Gewinnmargen um die 1000 %, wenn ich mich nicht irre.
        Da irrst du dich, das war keine Meldung von Nvidia, sondern eine Rechnung von irgendjemandem.
        Die Rechnung wurde auf CB aber zumindest bereits wiederlegt
      • Von DoctorChandra
        Zitat von VanWayne
        Ich hoffe, dass Nvidias KI-Dominanz nur zeitlich begrenzt ein Monopol innehat.
        Zitat von VanWayne
        AMD löst ein noch mulmigeres Gefühl aus, als es Nvidia tut, da der Preis die Leistung noch weniger rechtfertigt.
        FYI

        Einfach mal die Specs mit dem jeweils aufgerufenen Preis Vergleichen (NV H100 30´000 USD)

        "Mit einer Speicherbandbreite von 5,2 TByte/Sekunde und einer internen Infinity-Fabric-Bandbreite von immerhin noch 896 GByte/Sekunde überragt der MI300X Nvidias KI-System H100 faktisch gleich zweifach: Die Speicherdichte ist bis zu 2,4 Mal, die Speicherbandbreite bis zu 1,6 Mal höher."

        [Ins Forum, um diesen Inhalt zu sehen]

        [Ins Forum, um diesen Inhalt zu sehen]
      • Von latiose88 BIOS-Overclocker(in)
        [Ins Forum, um diesen Inhalt zu sehen]
        Das macht man nur wenn man Spiele auf dem PC keines findet aber dafür dann auf der Konsole sehr wohl. Nur das ist ein weiterer Grund die Plattform zu wechseln. Aber auch dir gpu zu teuer. Es sind also mehr Faktoren die eine Rolle spielen. Darum hat es sich so ergeben gehabt. Daran wird sich auch in Zukunft nix mehr ändern. Ich mag nur ne bestimmte Sorte von Spielen, darum wird die Auswahl immer sehr gering bleiben.
      • Von xDave78 Software-Overclocker(in)
        Zitat von VanWayne
        Womit wird der Aufpreis von Generation zu Generation gerechtfertigt?
        Du beantwortest es ja selber: mit dem Markt.

        Zitat von VanWayne
        Jetzt diese Meldung, dass AMD ja mal aufschließt.
        Naja leistungstechnisch ist es im Anbetracht dessen, dass AMD nach wie vor sowohl auf der CPU Schiene wie auch bei GPUs vergleichsweise ein "Underdog" ist - was die Firmengröße und die damit verbundene Risikofreudigkeit/- bereitschaft angeht. Klar interessiert Dich als Konsumenten das erstmal eher gar nicht. Dennoch ist es sicherlich ein Punkt, der die Leistung von AMD auch noch einmal hervorhebt.
        In Sachen Rasterisierung sind die Radeons ja auch super, wäre da nicht die unsägliche Software, die AMD nach wie vor nicht wirklich reibungslos zu laufen bekommt (obwohl auch hier deutliche Verbesserungen zu sehen sind - wenn auch suuuuper schleppend).

        Wenn man das Alles nicht mehr will, kann man als Gamer heutzutage ja auch guter Dinge auf eine der doch recht brauchbaren Konsolen umsteigen. Aber dies ist eine andere Geschichte, die fast so alt ist, wie das Gaming selbst -nur das in den 90ern die Konsolen wirklich besser waren.

        Zitat von VanWayne
        Du wusstest ja auf Anhieb, was ich meine und das ist das Ziel von Kommunikation.
        Naja ich bin ja auch super KLUK
        Und darüber hinaus ein unverbesserlicher Microsoft Fan.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 08/2026 PC Games 07/2026 play5 08/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk