/Server-Prozessoren: Qualcomm Centriq 2400 greift Intel Xeon an

Server-Prozessoren: Qualcomm Centriq 2400 greift Intel Xeon an

Qualcomm Centriq 2400

Qualcomm Centriq 2400

(Bild: Qualcomm)

Der 10-nm-Serverprozessor Centriq 2400 mit 40 bis 48 ARMv8-Kernen schlägt Intels jüngste Xeons in vielen Disziplinen, verspricht Qualcomm.

Attacke auf den Marktführer: Qualcomms ARM-Serverprozessor Centriq 2400 aus der 10-Nanometer-Fertigung von Samsung soll Intels Xeon Scalable Performance (Xeon-SP) in vielen Vergleichen schlagen. Qualcomm stellt drei Versionen des Chips mit 40, 46 und 48 Kernen vor, von denen der teuerste mit einem Listenpreis von 1995 US-Dollar die meisten Xeon-SP weit unterbietet. Auch AMD hat einige teurere Epyc-Versionen im Angebot.

Der Centriq 2400 ist für Einzelbetrieb gedacht, also für Server mit einer CPU. Als System-on-Chip (SoC) integriert er 32 PCIe-3.0-Lanes und 8 SATA-6G-Ports – ähnlich wie der AMD Epyc, der bei PCIe aber besser bestückt ist.

Die Speicher-Controller des Centriq 2400 binden in sechs Kanälen bis zu 768 GByte DDR4-RAM in Form von ECC-RDIMMs an. Eine Speicherkompression dient vor allem dazu, die Transferrate auszureizen. Ein Ringbus verbindet die 24 Dual-Core-Einheiten mit jeweils eigenen L3-Caches und Snoop-Filtern an den L2-Caches. Je zwei der “Falkor”-Kerne teilen sich 512 KByte L2-Cache.

Der 48-Kerner enthält insgesamt 60 MByte L3-Cache. Der 10-nm-Chip vereint auf 398 Quadratmillimetern Fläche mehr als 18 Milliarden Transistoren.

Zum Beleg der Centriq-Überlegenheit veröffentlicht Qualcomm eine Reihe von Vergleichen, die allerdings mit Vorsicht zu genießen sind: Viele Werte wurden extrapoliert. Zudem wurden alle Messungen am Centriq 2400 auf dem Qualcomm-internen Testsystem “QDT Software Development Platform v2” mit nur einem Prozessor durchgeführt – also nicht auf serienreifen Systemen und nicht Zwei-Sockel-Serverboards wie die meisten Vergleichsmessungen der Xeons, die Qualcomm erwähnt.

Centriq 2400 im Qualcomm-Vergleich
Prozessor Kerne/ TDP Preis SPECint_rate2006 SPECfp_rate2006
Threads Watt US-Dollar est. (GCC -O2 v6.1.1) est. (GCC -O2 v6.1.1)
Centriq 2460 48/48 120 W 1995 US-$ 657 607
Centriq 2452 46/46 120 W 1383 US-$ 636 k.A.
Centriq 2434 40/40 110 W k.A. 565 k.A.
Xeon Platinum 8180 28/56 205 W 10.009 US-$ (EP) 776 k.A.
Xeon Platinum 8160 24/48 150 W 4708 US-$ 613 535
Xeon Gold 6152 22/44 140 W 3655 US-$ (EP) 564 k.A.
Xeon Silver 4116 12/24 85 W 1012 US-$ (EP) 327 k.A.
Xeon Silver 4110 8/16 85 W 511 US-$ 221 k.A.
EP: Extrapoliert aus Qualcomm-Messungen der SPEC CPU2006 an Xeon Platinum 8160 und Silver 4110 und Vergleichen mit Werten von www.spec.org
Centriq 2400: CentOS 7.3, 6 × 32 GByte DDR4-2666
Xeon Platinum 8160: CentOS 7.4, 6 × 32 GByte DDR4-2666

Laut Qualcomm schlägt der Centriq jedenfalls konkurrierende Xeons deutlich in den Disziplinen Rechenleistung pro Watt und Rechenleistung pro Dollar. Zudem soll er im Leerlauf wesentlich sparsamer sein.

Für die Vergleiche zieht Quaclomm Ergebnisse des Benchmark-Suite SPEC CPU2006 heran, nämlich SPECint_rate_base2006 und SPECfp_rate_base2006. Die verschiedenen Centriq 2400 liefen dabei unter CentOS 7.3 und für die Messungen der Leistungsaufnahme unter Ubuntu 16.04.2 LTS.

Xeon Platinum 8160 und Xeon Silver 4110 hat Qualcomm in einem gängigen Supermicro-Server getestet, allerdings unter CentOS 7.4. Als Compiler kam jeweils GCC 6.1.1 zum Einsatz mit der Optimierung GCC -O2. Deshalb liegen die Werte der Xeons niedriger als bei den Ergebnissen auf www.spec.org, die durchweg mit stärker optimiernden Compilern von Intel (beziehungsweise AMD) entstanden sowie mit 32-Bit-Integer-Code und Libraries wie MicroQuill SmartHeap.

Die Ergebnisse der eigenen Messungen hat Qualcomm dann mit den optimierten Resultaten von spec.org verrechnet und daraus Ergebnisse für andere Xeons “extrapoliert” – wohl unter anderem deshalb, weil es so gut wie keine Single-Socket-Messungen aktueller Xeon-SP gibt.

Interessant wäre aber ein Vergleich mit AMD Epyc gewesen, der ausdrücklich auch auf Single-Socket-Server zielt.

SPECint_rate2006 von www.spec.org
Prozessor SPECint_rate_base2006 umgerechnet auf
2S (2 Prozessoren) 1 Prozessor (halbiert)
Xeon Platinum 8180 2710 1355
Xeon Platinum 8160 2140 1070
Xeon Gold 6152 1970 985
AMD Epyc 7451 1820 910
Xeon Silver 4116 1000 500
Xeon Silver 4110 624 312
Ergebnisse unter Linux, kompiliert mit optimierenden Compilern von AMD/Intel

Fragwürdig ist in diesem Zusammenhang der Preisvergleich zwischen Centriq 2400 und Xeon Platinum 8180: Hier liefert der Centriq laut Qualcomm die vierfache Performance pro US-Dollar. Wer aber einen möglichst kostengünstigen Xeon-Server mit vielen Kernen aufbauen möchte, würde dazu wohl kaum einen einzelnen der 10.000 US-Dollar teuren 28-Kern-Prozessoren nehmen, sondern stattdessen beispielsweise lieber zwei Xeon Gold 4116 für je 1000 US-Dollar, die zusammen 24 Kerne und 48 Threads bereitstellen. Und dann sieht der Preisvergleich anders aus, obwohl man einen Dual-Socket-Server mit zwei Xeons gegen ein Single-Socket-ARM-System stellt.

Qualcomm liefert die Centriq 2400 bereits “for revenue”, also wohl an Pilotkunden. Die normale Auslieferung soll aber noch 2017 anlaufen. Ein Nachfolger wird unter dem Codenamen Firetail entwickelt und soll neue ARMv8-A-Kerne namens Saphira enthalten.

Der ehemalige Intel-Manager Anand Chandrasekher, der nun bei Qualcomm auch für Centriq zuständig ist, hob anlässlich des Centriq-Starts auch die Kooperation mit chinesischen Regionalbehörden im Joint-Venture Guizhou Huaxintong Semi-Conductor Technology hervor.


(ciw)