AMD FirePro W9100 Review: Hawaii setzt auf Anzug und Krawatte

Die Unterschiede zwischen Hawaii und Tahiti GPUs Während Hawaiis 438-mm²-Chip immer noch kleiner ist als der GK110 auf Nvidias Quadro K6000, ist es die größte GPU, die AMD jemals hergestellt hat. Der legendäre R600 war "nur" 420 mm² groß. In den meisten Punkten ist die Implementierung der AMD Graphics Core Next-Architektur auf Hawaii fast identisch mit der Tahiti-GPU des FirePro W9000. Insbe

Die Unterschiede zwischen Hawaii und Tahiti GPUs

Während Hawaiis 438-mm²-Chip immer noch kleiner ist als der GK110 auf Nvidias Quadro K6000, ist es die größte GPU, die AMD jemals hergestellt hat. Der legendäre R600 war "nur" 420 mm² groß.

In den meisten Punkten ist die Implementierung der AMD Graphics Core Next-Architektur auf Hawaii fast identisch mit der Tahiti-GPU des FirePro W9000. Insbesondere ist der Compute Unit-Baustein derselbe. Alle 64 IEEE-754-2008-konformen Shader bestehen aus vier Vektor- und sechzehn Textur-Lade- / Speichereinheiten.

Es gibt natürlich Verbesserungen gegenüber der Tahiti-GPU auf AMDs FirePro W9000, wie z. B. flache Adressierung des Geräts zur Unterstützung von Standard-Aufrufkonventionen, Präzisionsverbesserungen der nativen LOG- und EXP-Operationen und Optimierungen der Masked Quad Sum of Absolute Differenz (MQSAD). Funktion, Beschleunigung von Algorithmen für die Bewegungsschätzung.

Und mit der Einführung von DirectX 11.2 wurden die programmierbare LOD-Klemmung und die Fähigkeit hinzugefügt, einem Shader zu sagen, ob eine Oberfläche resident ist. Beides sind Tier-2-Features, die mit gekachelten Ressourcen verknüpft sind.

Die wichtigste Abweichung von der GPU des W9000 ist die Anordnung von Compute Units. Während Tahiti 32 CUs mit insgesamt 2048 Shadern und 128 Textureinheiten verwendet, verfügt Hawaii über 44 CUs, die in vier von Shader Engines organisiert sind. Die Berechnung addiert 2816 Aggregat-Shader und 176 Textureinheiten.

Die neue GPU verwendet acht überarbeitete Asynchronous Compute Engines, die für die Planung von Echtzeit- und Hintergrundaufgaben an die CUs zuständig sind. Das W9000 hat nur zwei. Jeder ACE verwaltet bis zu acht Warteschlangen, insgesamt 64, und hat Zugriff auf L2-Cache und d-Speicher.

Es ist sehr sinnvoll, mehr Ressourcen für die Arbitrierung von GPU-Ressourcen zwischen Berechnungen und Grafiken bereitzustellen. Dies verbessert die Gesamteffizienz.

Die Front-End-Daten des W9000 flossen über ein Paar Geometrieprozessoren in die Shader. Angesichts seines Quad-Shader-Engine-Layouts verdoppelt der FirePro W9100 diese Anzahl, wodurch vier Primitive pro Taktzyklus anstelle von zwei Primitiven bereitgestellt werden. Es gibt auch mehr Zwischenspeicher zwischen dem Front- und dem Backend, um Latenzzeiten zu verbergen und so viel wie möglich von diesem primitiven Spitzen-Durchsatz zu realisieren.

Zusätzlich zu einer dedizierten Geometrie-Engine (und 11 CUs) verfügen Shader-Engines auch über einen eigenen Rasterizer und vier Render-Back-Ends mit einer Kapazität von 16 Pixeln pro Takt. Das sind 64 Pixel pro Takt auf der GPU - doppelt so viel wie die GPU des W9000. Der Hawaii-Chip des W9100 ermöglicht bis zu 256 Tiefen- und Schablonenoperationen pro Zyklus, was wiederum Tahitis 128-Fache verdoppelt.

Auf einer Grafikkarte, die für hohe Auflösungen ausgelegt ist, kommt eine große Pixel-Füllrate zum Tragen, die laut AMD in vielen Fällen den Leistungsengpass des Chips von Füll- auf Speicherbandbreite verlagert.

Der d L2-Schreib- / Lese-Cache wächst von 768 KB in Tahiti auf 1 MB, aufgeteilt in 16 64-KB-Partitionen. Dieser 33% ige Anstieg ergibt einen entsprechenden Bandbreitenanstieg zwischen den L1- und L2-Strukturen von 33%, wobei ein Spitzenwert von 1 TB / s erreicht wird.

Es macht daher Sinn, dass ein steigender Geometriedurchsatz, das Hinzufügen von 768 Shadern und das Verdoppeln der Spitzenpixelfüllung des Backends zusätzliche Anforderungen an Hawaiis Speicher-Subsystem stellen würde. AMD adressiert dies mit einem überarbeiteten Controller.

Die neue GPU verfügt über eine 512-Bit-Aggregatschnittstelle, die nach Angaben des Unternehmens etwa 20% weniger Fläche beansprucht als Tahitis 384-Bit-Design und 50% mehr Bandbreite pro mm² ermöglicht.

Wie ist das möglich? Es kostet tatsächlich Speicherplatz, um sehr schnelle Datenraten zu unterstützen. Also, 6 Gb / s bei höherer Spannung zu schlagen, machte Tahiti weniger effizient als Hawaiis Bus, der niedrigere Frequenzen bei niedrigerer Spannung anvisiert und folglich kleiner sein kann. Im Fall des FirePro W9100 mit 5 Gb / s, schiebt der 512-Bit-Bus bis zu 320 GB / s. Im Vergleich dazu erreichte Tahiti 288 GB / s.

Top