RISC-V als Grundlage: Raja Koduris neues Start-up will KI-Grafikkarten neu denken

News 07.08.2025 um 09:31 Uhr Jusuf Hatic Als bevorzugte Quelle auf Google hinzufügen

Quelle: Oxmiq Labs

Nvidias KI-Dominanz erhält einen neuen Gegner von einem Start-up, dessen Gründer so ziemlich bei jedem Nvidia-Konkurrenten angestellt war: Raja Koduri. Sein "Oxmiq Labs" genanntes Unternehmen setzt dabei auf RISC-V.

Raja Koduri ist mit Sicherheit kein Unbekannter in der Welt der Grafikkarten. In seiner fast dreißigjährigen Karriere, die bei S3 Graphics begann und ihn über ATI/AMD sowie Apple zu Intel führte, hatte Koduri bei einigen GPU-Entwicklungen seine Finger im Spiel. Seit seinem Intel-Aus im März 2023 blieb es lange ruhig um Koduri - bis jetzt, denn mit seinem neuen Start-up "Oxmiq Labs" präsentiert er seine Vision für die Zukunft der GPU-Technologie.

RISC-V als Revolutionstreiber

Das Herzstück dieser Vision liegt in der Nutzung der RISC-V-Architektur. Die freie und offene "Instruction Set Architecture" (ISA) lässt sich im Gegensatz zu proprietären Architekturen ohne Lizenzgebühren nutzen und anpassen.

Die daraus resultierende modulare Herangehensweise äußert sich etwa im skalierbaren GPU-Kern "OXCORE", der skalare, Vektor- und Tensor-Recheneinheiten integriert. Diese Kerne basieren auf dem erwähnten RISC-V und ermöglichen native Python-Beschleunigung sowie Kompatibilität mit SIMD/CUDA.

Ein weiteres Puzzleteil in Koduris Plänen hört auf den Namen "OXPython" - eine Kompatibilitätsschicht für Python-basierte CUDA-Anwendungen, die so ohne weitere Modifikation auf Hardware ausgeführt werden können, die nicht von Nvidia stammen.

Hierfür hat Oxmiq Labs prominente Unterstützung: Jim Keller - selbst eine CPU-Legende - und sein Unternehmen Tenstorrent liefern weitere Expertise im Bereich der RISC-V-basierten KI-Prozessoren mit.
Zudem beteiligt sich Mediatek als strategischer Investor mit einer Beteiligung an der 20 Millionen US-Dollar schweren Seed-Finanzierung.

Direkte Hardware verkauft Oxmiq Labs allerdings nicht. Stattdessen hat sich das Start-up bewusst für ein IP-Lizenzmodell entschieden - scheinbar mit Erfolg, denn eigenen Angaben zufolge konnte man bereits Gewinn mit der zugehörigen Software erzielen.

Quelle: Oxmiq Labs via Business Wire

Artikel teilen

Neues Start-up: Mit RISC-V und einem alten Bekannten gegen Nvidia-Dominanz Nvidias KI-Dominanz erhält einen neuen Gegner von einem Start-up, dessen Gründer so ziemlich bei jedem Nvidia-Konkurrenten angestellt war: Raja Koduri. Sein "Oxmiq Labs" genanntes Unternehmen setzt dabei auf RISC-V.

Per E-Mail versenden

- Kommentare (13)
  Zur Diskussion im Forum
  
  Von empy Lötkolbengott/-göttin
  
  Ist halt die Frage, ob das nötig wäre. Da es Gewichtsmatrizen sind, kann ein Gewicht halt auch null sein, dann ist die Verbindung halt nichtexistent oder nicht null, dann hat sie halt die entsprechende Stärke. Ich könnte mir da dann eher vorstellen, dass auf diese Art eventuell Bereiche inaktiv bleiben, die man dann auch nicht weiter berechnen muss und man so Rechenzeit sparen kann. So was heißt in der Regel dann "sparse"-irgendwas. So was lohnt sich aber oft auch schon, wenn man es (deutlich) gröber als eine übliche SIMD-Instruktion ausspart und die Randbereiche eben inklusive der unnötigen Berechnungen durch die Rechenwerke jagt. Umgekehrt könnte eine zu feine Detektierung wieder mehr Rechenarbeit kosten als sie spart.
  
  Aber das ist auch nur, was ich dazu denke. Mein Verständnis von neuronalen Netzen ist halt, dass es keine expliziten, harten Bedingungen gibt, das muss aber nicht stimmen. Es könnte aber auch in dem Fall sein, dass das dann nicht auf einzelne Berechnungen, sondern eher ganze Schichten oder so angewendet wird und dann auch wieder spielend grob genug ist, dass SIMD problemlos angewendet werden kann.
  
  Zitieren
  
  Von empy Lötkolbengott/-göttin
  
  Ist halt die Frage, ob das nötig wäre. Da es Gewichtsmatrizen sind, kann ein Gewicht halt auch null sein, dann ist die Verbindung halt nichtexistent oder nicht null, dann hat sie halt die entsprechende Stärke. Ich könnte mir da dann eher vorstellen, dass auf diese Art eventuell Bereiche inaktiv bleiben, die man dann auch nicht weiter berechnen muss und man so Rechenzeit sparen kann. So was heißt in der Regel dann "sparse"-irgendwas. So was lohnt sich aber oft auch schon, wenn man es (deutlich) gröber als eine übliche SIMD-Instruktion ausspart und die Randbereiche eben inklusive der unnötigen Berechnungen durch die Rechenwerke jagt. Umgekehrt könnte eine zu feine Detektierung wieder mehr Rechenarbeit kosten als sie spart.
  
  Aber das ist auch nur, was ich dazu denke. Mein Verständnis von neuronalen Netzen ist halt, dass es keine expliziten, harten Bedingungen gibt, das muss aber nicht stimmen. Es könnte aber auch in dem Fall sein, dass das dann nicht auf einzelne Berechnungen, sondern eher ganze Schichten oder so angewendet wird und dann auch wieder spielend grob genug ist, dass SIMD problemlos angewendet werden kann.
  
  Zitieren
  
  Von PCGH_Torsten Kokü-Junkie (m/w)
  
  Ich glaube, es gibt auch abhängige Verknüpfungen. Könnte man natürlich als mehrdimensionale Matrize mit Co-Faktor bezeichnen – aber gibt es SIMD-Befehlssätze, die etwas von der Art "Multipliziere A mit C wenn B = X oder multipliziere A mit D wenn B = Y | Multipliziere E mit G wenn F = Z oder multipliziere E mit H wenn F != Y | ...." am Block ausführen können. Das ist einfach nicht mehr "Single Instruction".
  
  Zitieren
  
  Von empy Lötkolbengott/-göttin
  
  Zitat von PCGH_Torsten
  
  Der Trick besteht wohl darin, dass man die Daten des neuronalen Modells möglichst nicht hin und her bewegt, sondern einzelne, winzige Anteile, lokal an einem (ebenfalls winzigen) Rechenknoten belässt und dann nur die zu verarbeitenden Daten von Punkt zu Punkt strömen lässt.
  
  Ja, man sollte dafür sorgen, dass die Caches greifen können. Das ist ein allgemeines Problem des verteilten Rechnens, dass halt nicht jeder Knoten gleich schnell auf alle Daten zugreifen kann. Ich glaube man begegnet dem, indem man die Unteraufgaben in ihrer Größe so wählt, dass sie immer lokal ausgeführt werden können.
  
  Zitat von PCGH_Torsten
  
  Herkömmliches SIMD sehe ich bei KI aber nicht am Start – bei mehreren Schichten Quervernetzung die durchzuführende Operation herauszufinden ist aufwendig, die eigentliche Berechnung dann teilweise trivial. 64 Operanden zu suchen, auf die man in einem Rutsch die gleiche Instruktion anwenden kann, müsste kontraproduktiv sein.
  
  Sind die Inputs und Outputs von neuronalen Netzen nicht Vektoren und die einzelnen Schichten und damit die Verbindungen zwischen den "Neuronen" nicht die Gewichtsmatrizen und das ganze wird dann miteinander multipliziert?
  
  Zitieren
  
  Von BxBender Volt-Modder(in)
  
  oh neee, ich hab doch nur aus Spaß gesagt, ob der Koduri bei der Zeus seine Finger im Spiel hat mit 10facher Leistung einer 5090, und dann kommt keine 3 Tage später dieser Hammer hier, LOL
  
  PS: der Kerl war echt bei S3? das erklärt den S3 Virge (auf Deutsch Würg gesprochen??? ^^) in den 90ern, der die Leistung gegenüber dem Softwaremodus halbiert hat, hätet ichd as gewusst, hätet ich keine 300 DM hingeblättert, was extrem teuer war und nie gebraucht werden konnte, mein Fehlkauf schlechthin, noch ohne PCGH wohlgemerkt
  
  Zitieren
  
  Von PCGH_Torsten Kokü-Junkie (m/w)
  
  Der Trick besteht wohl darin, dass man die Daten des neuronalen Modells möglichst nicht hin und her bewegt, sondern einzelne, winzige Anteile, lokal an einem (ebenfalls winzigen) Rechenknoten belässt und dann nur die zu verarbeitenden Daten von Punkt zu Punkt strömen lässt. Um deren Bewegung kommt man ja sowieso nicht herum. Soweit jedenfalls mein oberflächliches Verständnis der NPU-Konzepte von Intel und, soweit dokumentiert, AMD. Kann aber natürlich sein, dass sich das mit Agenten-basierten KIs schon wieder erledigt hat. Herkömmliches SIMD sehe ich bei KI aber nicht am Start – bei mehreren Schichten Quervernetzung die durchzuführende Operation herauszufinden ist aufwendig, die eigentliche Berechnung dann teilweise trivial. 64 Operanden zu suchen, auf die man in einem Rutsch die gleiche Instruktion anwenden kann, müsste kontraproduktiv sein.
  
  Zitieren
  
  Direkt zum Diskussionsende

Hoch

Print / Abo

Apps

Die Redaktion Datenschutz Artikel-Archiv Datenschutz-Optionen Mediadaten Impressum Utiq verwalten Abo kündigen Vertrag widerrufen AGB Inhalt melden Newsletter

RISC-V als Revolutionstreiber

Artikel teilen

Kommentare (13)