Zweispurig rechnen

0
News Als bevorzugte Quelle auf Google hinzufügen

Über eine derart großzügig ausgebaute Straße lassen sich natürlich Unmengen von Daten hin und her transportieren; so viele, dass der Kern des Pentium 4 Daten und Instruktionen gar nicht so schnell verarbeiten kann, wie sie an- und abtransportiert werden könnten. Intel spricht von einer Netburst-Auslastung von nur 35 Prozent. Zum Teil ist dieser Umstand hausgemacht. Der Pentium 4 ist der erste Prozessor in der Geschichte der Intel-kompatiblen CPUs, der pro Takt langsamer arbeitet als sein Vorgänger; rund 20 Prozent sollen es sein, wie Mitbewerber AMD nicht müde wird zu betonen. Mit der Bereitstellung von zwei logischen CPUs versucht Intel also zum einen, die bisher nicht gerade berauschende Pro-Takt-Effizienz des P4-Kern zu verbessern und zum anderem, die vorhandene Bandbreite zum Kern besser auszulasten.

Die Technik im Detail
Um einem Betriebssystem auch auf Einprozessor-Systemen zwei logische CPUs bereitstellen zu können, hat Intel verschiedene Bauteile im Kern auf verschiedene Arten "geteilt" (shared), repliziert (replicated) und gesplittet (partitioned). Der Level-1- und -2-Cache etwa dient beiden logischen Prozessoren gleichermaßen als Puffer. Das hat den Vorteil, dass Daten, die in beiden LPs verarbeitet werden müssen, schnell und bequem erreichbar sind. Auf echten Multiprozessor-Systemen mit separaten Caches wird das System ausgebremst, wenn der Code verarbeitet wird, dessen Daten für beide CPUs relevant sind.

Andere Bauteile dagegen, wie etwa der Re-Order Buffer, werden von den LPs parallel 1:1 geteilt verwendet, während jene Einheiten, deren reale Bauteile ohnehin mehrfach vorhanden sind, kurzerhand repliziert wurden. Darunter fällt zum Beispiel die Einheit für das Register-Renaming oder der Instruction Pointer in der I-Fetch-Unit.

Wo ist der Haken?
Die HT-Einheiten schlummern seit der Vorstellung des Pentium 4 in den Kernen - wurde aber deaktiviert. Wie Intel offiziell verlauten lässt, sei die Software damals noch nicht reif gewesen. Wie bei echten SMP-Systemen profitieren auch bei HT hauptsächlich jene Betriebssysteme und Programme, die "threaded" programmiert sind. Sind sie es nicht, laufen die Anwendungen unter Umständen langsamer als mit nur einer CPU. Wie man anhand unserer Benchmarks sehen kann, werden Programme, die nicht SMP-fähig sind, auf Dual-Systemen teilweise gebremst. Die Ursache dafür trägt den Namen "Verwaltungs-Overhead". Eine Plattform mit zwei Prozessoren verursacht zusätzlichen Verwaltungs-Aufwand. Da müssen Cache-Inhalte abgeglichen werden, Bandbreiten geteilt und Zugriffserlaubnisse eingeholt respektive erteilt werden. Zieht ein Programm keinen Nutzen aus der Rechenkraft des zweiten Prozessors, läuft es somit langsamer als ohne. Bei Hyper Threading ist der Effekt zwar nicht so dramatisch, andererseits aber auch nicht wegzudiskutieren.

Welche Software brauche ich für HT?
Um einen Vorteil aus Hyper Threading ziehen zu können, müssen Sie ein Betriebssystem zum Einsatz bringen, das damit umzugehen weiß. Man könnte annehmen, dass ein Betriebssystem, welches für Mehrprozessor-Systeme geeignet ist, auch für HT die richtige Wahl sei; doch das ist nicht immer richtig. Windows XP Home ist zwar HT-tauglich, kann aber mit einem echten Mehrprozessor-System nichts anfangen. Im Gegenzug dazu wird Windows 2000 in allen Editionen, ein beliebtes und weit verbreitetes SMP-OS, für den Betrieb mit Hyper-Threading-CPUs nicht von Intel empfohlen. Linux unterstützt ab Kernel 2.4.18 ebenfalls Hyper Threading, das entsprechende HT Technology Logo jedoch bekommen vorerst nur die Microsoft Betriebssysteme Windows XP Pro und Home. MS-DOS, Windows 95/98 oder Millennium Edition (ME) können weder mit SMP noch mit HT umgehen.

Artikel teilen

Per E-Mail versenden

0
  1. Seite 1
  2. Seite 2
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk