Defekte RX-6000-Grafikkarten: Treiber offenbar doch nicht schuld
Die auffällige Häufung von defekten RX-6000-Grafikkarten wird offenbar doch nicht durch den Treiber verursacht. Stattdessen soll die Lagerung schuld sein. Konkret wird vermutet, dass ein Händler falsch gelagerte Mining-Grafikkarten verkauft hat.
Letzte Woche berichteten wir über den bayrischen Reparaturdienstleister KrisFix, bei dem es eine auffällige Häufung von GPU-Defekten gab: Dort wurden mehrere RX-6000-Grafikkarten eingeschickt, die offenbar durch Kurzschlüsse außer Gefecht gesetzt wurden. Die Ursache für diese Defekte war dabei anfangs unklar. Da alle betroffenen Modelle mit demselben Treiber (Version 22.11.2 WHQL) betrieben wurde, wurde aber zunächst dieser als Auslöser vermutet. Denkbar wäre etwa eine Überlast durch ein softwareseitig höheres TDP-Limit gewesen.
Der Händler als Ursache?
Ein Update von KrisFix korrigiert diese Annahme aber nun: Der Treiber ist offenbar nicht die Ursache für diese Defekte. In einem neuen Video weist er stattdessen darauf hin, dass die meisten der betroffenen Grafikkarten vom selben Händler verkauft wurden. Im Zusammenhang mit der Tatsache, dass die Modelle zur Reparatur und nicht zu AMD geschickt wurden, spricht das zunächst für den Einsatz von älteren Gebrauchtmodellen. Ein weiteres Detail: Die defekten Grafikkarten haben zumeist schon kurz nach dem Kauf ihren Dienst quittiert.
Aus diesen Informationen entsteht bei KrisFix die Vermutung, dass es sich um gebrauchte Mining-Grafikkarten handelt, die nach der Auflösung der entsprechenden Farm nicht korrekt gelagert wurden. Bei der inkorrekten Lagerung könnten die Bauteile auf den Grafikkarten demnach Wasser gezogen haben, das bei Vollast anschließend für die Kurzschlüsse gesorgt haben soll. Sofern diese Annahme richtig ist, wäre damit ausschließlich die unzureichende Lagerung für die Defekte verantwortlich - und nicht AMD oder ein Boardpartner.
Die Vorgeschichte: Treiber schuld? Bericht über Häufung von defekten RX 6000-Grafikkarten
Ob die Lagerung tatsächlich die Ursache für das Problem ist, lässt sich im Nachhinein natürlich nur vermuten. Die Aufnahme von Feuchtigkeit würde aber tatsächlich zu dem beobachteten Schadensbild passen: Wassermoleküle können sich mit der Zeit in vielen (Kunst-)Stoffen anlagern. Bei schnell steigender Temperatur kann die rasante Ausdehnung des Wassers anschließend dafür sorgen, dass die Bauteile von innen aufgesprengt werden. Das ist insbesondere in der Elektronikfertigung ein Problem: Dort werden die einzelnen Bauteile vor dem Löten deshalb zunächst langsam getrocknet.
Quelle: Videocardz / Twitter (Andreas Schilling)

Ich bitte jetzt einmal ganz freundlich wieder zurück zum Thema zu kommen.
Das ist so nicht ganz korrekt. Bei uns werden feuchteempfindliche Bauteile (IC, BGAs, CPUs etc) generell mit Trockenmittel in luftdicht verschlossenen ESD-Tüten verpackt gelagert. Bauteile die durch Feuchtigkeit aufplatzen sind auch eher die Seltenheit.
Das größte Problem stellt die Korrosion auf den Lötstellen dar, wodurch die elektrische Verbindung zwischen Leiterplatte und Bauteil nicht hergestellt werden kann.
Zurück zum Thema:
Ich persönlich wüsste auch nicht, wie jetzt Feuchtigkeit zu Rissen bzw einem Bruch in den GPUs führen soll, gerade weil die empfindlichen Teile alle vergossen sind. Einzige Möglichkeit wäre hier zwischen dem BGA und der Leiterplatte, was dann aber direkt zu Kurzschlüssen und Gestank führen sollte.
Hierzu würde möchte ich auch nochmal meine persönlichen Festellungen anhand des ersten Videos/Bilder teilen:
Der Lüfter sieht aus wie neu und unbenutzt.
Die Wärmeleitpads der BGAs auf der Platine sind auf der unteren Hälfte total zerquetscht und oben schauen sie jungfräulich aus. Auf der rechten Seite sehen sie aus, als hätten sie zu viel wärme bekommen.
Auf dem Kühler sieht es ähnlich aus.
Dann die Sache mit dem gebrochenen GPU-Chip...
Ich denke da wurde der Kühler unsachgemäß entfernt und wieder drauf gebaut. Dabei dann möglicherweiße der Bruch des Chips...
Und wenn man sich die Schrauben oben anschaut sieht man auch deutlich, dass teilweise noch der blaue Sicherungslack drauf ist, während er bei anderen komplett fehlt.
Unabhängig davon glaube ich, dass an der Karte schon mal was gemacht wurde. Wenn er sie im Video kurz umdreht, sieht man im Bereich der Steckkontakte Verfärbungen.
Daher mein Tip: Unsachgemäße Kühlermontage
Aber da es jetzt wahrscheinlich Miningkarten sind, könnte das ganz gut passen.
Dass es nicht so ist hat er dann durch Tasten solcher Karten mit Messungen und verschiedenen Treiber Versionen herausgefunden, da der Treiber da keinen Einfluss auf die Spannungen / takte hatte. Er hat dann 150h (mehr als 6 (!) Tage) für verschiedene Tests investiert und auch die Besitzer der Karten weiter befragt, und dadurch ist er dann auf die Gemeinsamkeit des Verkäufers bzw. Der lagerung bei hoher Feuchtigkeit gekommen.
Das die lagerung von Hardware bei Nässe / höher Luftfeuchtigkeit nicht gut für diese ist, sollte für jeden klar sein. Oder ist es eine gute Idee nen PC im Winter im Freien bei kalten Temperaturen länger stehen (also zu betreiben) zu haben, oder im Kühlschrank eingebaut zu haben?
Dass sich dann Leute über ihn aufregen ist einfach unverständlich... Er versucht Erfahrungen zu diesem Problem zu sammeln, macht ein Video dazu, woraus andere dann ableiten, dass es ein Fakt ist, dass der Treiber schuld ist. Er investiert dann sehr viel Zeit in das Thema um zu einer (möglichen) Lösung zu kommen, und dann wird er schlecht gemacht weil er "amd Treiber schlecht redet", oder das video "nur für klicks machte". Und sowas sagen dann wahrscheinlich auch Leute die noch nie was mit Hardware zu tun hatten und gerade mal wissen wie man einen PC ein / ausschaltet...
Und wer sagt "war eh klar, der Treiber kann ja gar nichts daran ändern" - schaut mal auf die Intel Treiber, bei der arc A770 gab's ein Treiber Update welches den RAM takt erhöht, da der anfangs zu niedrig war. Also durchaus möglich dass ein Treiber Update da was ändert...
Zudem plädiere ich dazu "2900133081" mit seinen Falschaussagen zu konfrontieren. Gerne mache ich bei der Empörungswelle mit. Damit wird die Aufmerksamkeit erfolgreich von mir abgelenkt.
Des weiteren: Schimmel ist eine echte Gefahr. Nicht umsonst gibt es in jedem Supermarktregal "Schimmelbekämpfungsmittel". Die Radeon Grafikkarten verschimmeln von innen her. Das ist aus den zahlreichen chinesischen Foren, die ich aus Sicherheitsgründen nicht veröffentliche, bekannt. Bitte Googlen (wenn möglich auf chinesisch).
Deine Schimmeltheorie in allen Ehren, aber ich nutze schon seit jeher AMD Grakas und selbst die ausgemusterten Modelle sind mir noch nicht zwischenzeitlich weggeschimmelt.
Wenn man seinen Rechner nicht in einer Tropfsteinhöhle stehen hat und diesen nur 1x pro Woche für eine Stunde laufen lässt, sollte das unmöglich sein.
Die Aufmerksamkeit auf einen anderen User lenken zu wollen ist schon ziemlich dreist.
Übrigens habe ich mal nach "AMD, Hardware, Schimmel" gegoogelt und nur links zu fehlerhaften WaKüs gefunden.
Solange Du hier also keinen Link parat hast, kannst Du Dir jeden weiteren Post klemmen.