https://www.golem.de/2005/148364-232298-232294_rc.jpg
Zhaoxin KX-U6780A(Bild: Martin Wolf/Golem.de)

Das kann Chinas x86-Prozessor

Nicht nur AMD und Intel bauen x86-Chips, sondern auch Zhaoxin. Deren Achtkern-CPU fasziniert uns trotz oder gerade wegen ihrer Schwächen.

by

In China hat unlängst eine Entwicklung stattgefunden, die durch den aktuellen Handelsstreit mit den USA spannender denn je ist: Zhaoxin hat selbst Prozessoren entworfen, die auf x86-Technik setzen. Wir haben uns mit dem KX-U6780A ein aktuelles Achtkernmodell ins Testlabor geholt, um herauszufinden, wie er sich gegen die x86-CPUs von AMD, Intel sowie Via schlägt. Kurz gesagt: Schnell ist der KX-U6780A nicht, aber dennoch faszinierend.

Via Technologies spielt für Zhaoxin eine wichtige Rolle: Das chinesische Unternehmen heißt eigentlich Shanghai Zhaoxin Semicondutor Corporation. Dahinter verbirgt sich ein im Frühjahr 2013 geschaffenes Joint Venture zwischen Via und der Shanghai Alliance Investment Corporation, die zur Lokalregierung Shanghais gehört. Zhaoxin ist somit ein staatlich unterstützter CPU-Hersteller, der x86-Chips für den eigenen Markt entwickeln soll.

Die notwendige x86-Lizenz kommt von Via aus Taiwan, genau genommen von deren US-amerikanischer Centaur-Tochter, die im August 1999 übernommen wurde. Centaur entwickelt selbst x86-CPUs, derzeit etwa das CHA-Design mit integriertem Co-Prozessor für künstliche Intelligenz. Davor entwarf Centaur die Isaiah-Architektur, die 2008 mit den ersten Nano-Modellen eingeführt wurde. In den folgenden Jahren erweiterte Centaur das Design auf zwei und vier Kerne, hinzu kamen eine feinere Fertigung - 40 nm statt 65 nm - und höhere Frequenzen. Aktuell ist der Eden C4650 von 2015, der mit 2 GHz läuft.

An dieser Stelle hat Zhaoxin angesetzt und mit dem C4350AL (ZX-A) einen ersten Prozessor veröffentlicht. Er entspricht praktisch einem Via Nano X2 L4350E (CNQ), hat also zwei Kerne und wird im 40-nm-Verfahren bei TSMC gefertigt. Für die quasi identischen ZX-B wechselte Zhaoxin den Auftragsfertiger und bog das Design so um, dass es vor Ort in 40 nm von HLMC (Shanghai Huali Microelectronics Corporation) produziert werden konnte.

Bei den ZX-C alias KX-4000 führte Zhaoxin erstmals Kaixian als Markenname ein, zudem wurde die Isaiah- durch die eigene Zhangjiang-Technik ersetzt. Wie viel dort tatsächlich neu ist und nicht von Centaur stammt, wissen wir nicht. Offenbar handelt es sich rein um einen Shrink und keine überarbeitete Architektur, denn statt HLMCs 40 nm wurde TSMCs 28 nm herangezogen. Die vier Kerne sind nativ, wie bei Via auch - zuvor gab es zwei Chips auf einem Träger. Mit den KX-5000 (ZX-C+) koppelte Zhaoxin dann zwei Quadcore-Dies, um so acht CPU-Kerne zu erhalten. Außerdem wurde die Zhanjiang-Technik um SM3 und SM4 erweitert: Diese Verschlüsselungsverfahren sind erforderlich, damit die Prozessoren in staatlichen Institutionen in China eingesetzt werden dürfen.

C4350AL(?)KX-4000KX-4000KX-5000KX-6000KX-7000
CodenameZX-AZX-BZX-CZX-C+ZX-DZX-EZX-F
ArchitekturIsaiah (Via CNQ)Isaiah (Via CNQ)Zhangjiang (Via CNR)Zhangjiang (Via CNR)WudaokouLujiazui(?)
Fertigung40 nm TSMC40 nm HLMC28 nm TSMC28 nm TSMC28 nm HLMC16 nm TSMC7 nm TSMC
DesignCPU + I/OCPU + I/OCPU + I/OCPU + I/OSoCSoCSoC
Kerne2244+4 (MCM)888
Takt1,6 GHz2 GHz2 GHz2 GHz2 GHz3 GHz(?)
SpeicherDDR3-1600DDR3-1600DDR3-1600DDR3-1600DDR4-2400DDR4-3200DDR5
Release201420142015201620182020(?)

Zhaoxin-Generationen

Waren bisher alle CPUs auf einen I/O-Chip namens ZX-100S angewiesen, handelte es sich bei den KX-5000 (ZX-D) um Systems-on-a-Chip: Die Prozessoren integrieren Speichercontroller, PCIe Gen3, USB 3.2 Gen2 und Sata-6-GBit/s. Die Fertigung erledigte HLMC mit 28 nm, wobei Kernzahl und Takt nicht stiegen, dafür wurde DDR4-2400 statt DDR3-1600 unterstützt. Die aktuellen KX-6000 (ZX-E) führen das SoC-Prinzip fort, dank eines Shrinks auf TSMCs 16 nm gibt es aber 3 GHz statt 2 GHz und DDR4-3200.

Schauen wir uns an, was der KX-U6780A zu bieten hat.

Ein Kern wie eine Shanghaier Metro-Station

Zhaoxin setzt bei den ZX-E alias KX-6000 auf acht Kerne samt I/O-Funktionen in einem monolithischen System-on-a-Chip. Das SoC wird bei TSMC mit 16FFC-Verfahren gefertigt, das steht für Finfet Compact und ist ein kostenoptimierter Node. Das SoC ist mit einem 35 x 35 mm großen Package verlötet statt gesockelt.

Intern bestehen die KX-6000 aus zwei CPU-Clustern mit je vier Kernen, es ist kein Simultaneous Multithreading (SMT) vorhanden. Pro Core gibt es 32 KByte L1-Instruktionen und 32 KByte L1-Daten-Cache, beide sind 8-fach assoziativ ausgelegt. Die beiden Cluster teilen sich einen 4 MByte großen L2-Cache und kommunizieren per Crossbar. Einen L3-Puffer, wie er bei AMD und Intel schon seit vielen Jahren üblich ist, gibt es bei den ZX-E nicht. Die Kerne unterstützen Befehlssatzerweiterungen wie SSE 4.2 und AVX, außerdem AES und SHA und eben SM3/SM4 für den chinesischen Markt. Die Lujiazui-Mikroarchitektur ist wie alle anderen nach Metro-Stationen in Shanghai benannt, sie soll pro Takt gleich 50 Prozent schneller sein als zuvor. Mitigationen gegen Spectre V2 sind gegeben, Meltdown ist ohnehin kein Problem.

In ihrem Verhalten ähneln die acht Cores eines KX-6000 grob den CCX von AMD: Solange sich vier Kerne innerhalb eines Clusters austauschen, liegt die Latenz bei einem Drittel dessen, was an Zeit benötigt wird, um einen Kern im anderen Cluster anzusprechen. Leider misst Sisoft Sandra die Latenz in Nanosekunden falsch, weshalb wir auf die korrekten Werte von Anandtech zurückgegriffen haben.

https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-00.jpg
Zhaoxins ZX-U6780A (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-02a.jpg
Links der Die-Shot eines KX-5000, ein KX-6000 dürfte ähnlich aussehen. Recht die internen Kern-zu-Kern-Latenzen. (Bild: Zhaoxin)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-03.PNG
CPU-Details zum ZX-U6780A (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-04.jpg
Cjoyin C1888 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-05.jpg
Cjoyin C1888 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-06.jpg
Cjoyin C1888 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-07.png
Roadmap mit KX-7000 (Bild: Zhaoxin via Wikichip)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-07a.jpg
Erwartete Performance-Zuwachs bei Single- und Multithreading (Bild: Zhaoxin)

Mit im Chip steckt ein DDR4-3200-fähiger Speichercontroller, der im 128-Bit-Dualchannel-Modus arbeitet. Somit stehen maximal theoretisch 51,2 GByte/s an Bandbreite zur Verfügung. Jeder KX-6000 integriert zudem einen Root-Controller für 16 PCIe-Gen3-Lanes, an welche Grafikkarten, NMVe-SSDs oder Ethernet-Chips angeschlossen werden können. Bei der iGPU handelt es sich um eine C-960, die zumindest laut Zhaoxin auf einer eigenen Lösung statt auf einer Chrome von HTCs S3 Graphics basiert. Sie unterstützt OpenCL 1.1, OpenGL 3.2 und Direct3D 11.

So können wir einen 4K-Monitor mit 60 Hz anschließen und VP9-codierte Clips anschauen, allerdings maximal in 1080p60. Bei höheren Auflösungen lässt die C-960-Grafik ständig Frames fallen, weshalb das Video dann stark ruckelt. Filme oder Serien bei Amazon, Google oder Netflix schauen klappt leider nicht - vermutlich fehlt hier die Unterstützung der entsprechenden DRMs. Lokale Videos mit H.264- oder H.265-Codec können allerdings in 1080p-Auflösung abgespielt werden.

Für unsere Tests verwenden wir ein Cjoyin C1888, ein Mainboard mit verlötetem KX-U6780A. Cjoyin legt ein 96-Watt-Netzteil bei, was für den Basisbetrieb ausreicht. Wer eine dedizierte Grafikkarte nutzen möchte, kann den 4-Pin-EPS-Anschluss verwenden und muss dafür den 24-Pin-Stecker des Netzteils überbrücken. Die Platine weist HDMI, VGA, USB-A 3.2 Gen1, Sata 6 GBit/s und doppeltes Gigabit-Ethernet auf. Auf der Rückseite gibt es einen M.2-Slot, der jedoch nur NVMe- und keine Sata-SSDs aufnimmt.

https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-00.jpg
Zhaoxins ZX-U6780A (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-02a.jpg
Links der Die-Shot eines KX-5000, ein KX-6000 dürfte ähnlich aussehen. Recht die internen Kern-zu-Kern-Latenzen. (Bild: Zhaoxin)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-03.PNG
CPU-Details zum ZX-U6780A (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-04.jpg
Cjoyin C1888 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-05.jpg
Cjoyin C1888 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-06.jpg
Cjoyin C1888 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-07.png
Roadmap mit KX-7000 (Bild: Zhaoxin via Wikichip)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-07a.jpg
Erwartete Performance-Zuwachs bei Single- und Multithreading (Bild: Zhaoxin)

Die beiden SO-DIMM-Steckplätze für DDR4-Speicher haben wir mit Gskills F4-2666C18D-16GRS bestückt, denn Cjoyin gestattet maximal DDR4-2666. Takt oder Latenzen lassen sich nicht einstellen, es wird schlicht das höchste Jedec-Profil (SPD) geladen. Schade: Das Board beherrscht nur Singlechannel, was die CPU-Leistung sehr wahrscheinlich aber kaum verringert.

KerneL2-CacheTaktSpeicherTDP
KX-U6880A84 MByte3,0 GHzDDR4-320070 Watt
KX-U6780A84 MByte2,7 GHzDDR4-320070 Watt

Spezifkationen der Zhaoxin KX-6000

Neben dem KX-U6780A gibt es generell noch den KX-U6880A, dieser taktet ein bisschen flotter. Im Leerlauf liegen 1,2 GHz an - unter Last hingegen sind es 2,7 GHz respektive 3 GHz. Über Boost-Modi, um eine einzelne Kerne schneller laufen zu lassen, verfügen beide Zhaoxin-SoCs nicht. Mögen die Benchmarks beginnen!

Atom und Bulldozer schlagen den Megacore

Um den KX-U6780A zu vergleichen, haben wir uns für ein bunt gemischtes Testfeld entschieden: Der Eden C4650 mit vier Kernen ist der geistige Vorgänger von Centaur, der FX-8350 mit Bulldozer-Architektur ein 28-nm-Modell von 2012, der Pentium G5400 eine Dualcore-Einsteiger-CPU und der Pentium J5005 ein Atom-Quadcore. Wo möglich, haben wir die integrierte Grafik genutzt.

Vorneweg ein paar Worte zur generellen Performance: Trotz 16 GByte RAM und einer NVMe-SSD fühlt sich der KX-U6780A an wie ein schon etwas betagteres Gerät. Das liegt einerseits an der niedrigen Leistung pro Takt und pro Kern, aber auch am sogenannten Frequency Ramp: Aktuelle Chips von AMD und Intel takten ihre CPUs in wenigen Millisekunden unabhängig vom Betriebssystem hoch, was Programmstarts oder die Browser-Responsivität spürbar beschleunigt. Der KX-U6780A braucht dafür viel länger, weshalb er sich ähnlich träge anfühlt wie ein Intel Atom oder der FX-8350.

Das heißt keineswegs, dass der Zhaoxin-Chip sich nicht für den Alltag eignet, ein bisschen Geduld müssen Anwender jedoch mitbringen. Um herauszufinden, wie sich der KX-U6780A in einem typischen Szenario daheim schlägt, haben wir den Essentials-Test und Microsoft Office 365 per Applications-Test des PCMark 10 (siehe PDF für Details) verwendet. Hier zeigt sich, dass das Zhaoxin-SoC beim Aufrufen von Apps langsam ist und auch Browser wie Chromium, Edge sowie Firefox sich weniger zügig bedienen lassen als selbst beim gemächlich agierenden Atom alias Pentium J5005. E-Mails verfassen, Texte schreiben oder Tabellen bearbeiten klappt dafür zügig.

https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/01-7-zip-v19.00-x64-(compression,-32m,-10-passes)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/02-7-zip-v19.00-x64-(decompression,-32m,-10-passes)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/03-blender-v2.82a-(ryzen-logo)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/04-y-cruncher-v0.7.8.9506-(1-billion-digits,-wall-time)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/05-faststone-image-viewer-v7.5-(25-raws-to-jpeg,-3333pix,-sharpening)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/06-cinebench-r20-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/07-cinebench-r11.5-x64-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/08-luxmark-3.1-(c)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/09-pcmark10-essentials,-score-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/10-pcmark10-essentials,-app-startup-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/11-pcmark10-essentials,-video-conference-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/12-pcmark10-essentials,-web-browsing-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/13-pcmark10-apps-(office-365),-score-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/14-pcmark10-apps-(office-365),-edge-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/15-pcmark10-apps-(office-365),-excel-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/16-pcmark10-apps-(office-365),-powerpoint-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/17-pcmark10-apps-(office-365),-word-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/18-basemark-web-3.0-(chromium-edge)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/19-webxprt-3-v5-(chromium-edge),-score-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/20-webxprt-3-v5-(chromium-edge),-album-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/21-webxprt-3-v5-(chromium-edge),-encrypt-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/22-webxprt-3-v5-(chromium-edge),-homework-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/23-webxprt-3-v5-(chromium-edge),-photo-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/24-webxprt-3-v5-(chromium-edge),-sales-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/25-webxprt-3-v5-(chromium-edge),-stock-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/26-geekbench-5.1.1-x64-(multi)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/27-geekbench-5.1.1-x64-(single)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/28-geekbench-5.1.1,-subtests-(multi,-crypto)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/29-geekbench-5.1.1,-subtests-(multi,-integer)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/30-geekbench-5.1.1,-subtests-(multi,-float)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/31-geekbench-5.1.1,-subtests-(single,-crypto)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/32-geekbench-5.1.1,-subtests-(single,-integer)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-KX-U6780A-Benches/thumb620/33-geekbench-5.1.1,-subtests-(single,-float)-chart.png
16 GByte DD3/DDR4, iGPU except R7 240 for FX-8350, Windows 10 v1909 (Bild: Golem.de)

Unsere Messwerte belegen, dass der KX-U6780A bei der IPC im Mittel noch unter einem aktuellen Atom angesiedelt ist. Einzig bei 7-Zip, vor allem beim Dekomprimieren, kann sich der KX-U6780A pro Takt von Pentium J5005 absetzen. Aufgrund von acht statt vier Kernen erreicht der Zhaoxin-Chip teilweise eine ähnliche oder leicht höhere Geschwindigkeit, über alle Benchmarks hinweg besteht quasi ein Patt zwischen dem Atom und dem KX-U6780A (+4%). Gegen einen FX-8350 mit pro Takt ebenfalls niedriger Leistung verliert das chinesische SoC, der Bulldozer ist viel flotter (+65%). Verglichen mit dem Eden C4650 hat der KX-U6780A doppelt so viele Kerne und ein Drittel mehr Takt bei zumindest ähnlicher Architektur, weshalb das Zhaoxin-SoC weit vorn liegt (+94%).

Im Leerlauf benötigt die Cjoyin-Platine rund 15 Watt, der NUC9 mit Atom begnügt sich mit 7 Watt. Unter Blender-Last steigt die Leistungsaufnahme des Zhaoxin-Systems auf 80 Watt, der Intel-Mini genehmigt sich 18 Watt. Das idle/load-Delta von 65 Watt bewegt sich ungeachtet der Verluste durch die Spannungswandler und des externen Netzteils genau im Bereich der 70 Watt TDP, die Zhaoxin für die KX-6000 angibt. Da der KX-U6780A niedriger taktet als der KX-U6880A, könnte das Topmodell mehr Energie benötigen.

Weil alle Werte unter Windows 10 entstanden sind, haben wir uns noch angeschaut, ob der Zhaoxin-Chip auch unter Linux funktioniert.

Linux-Support mit aktuellem Kernel

Ein x86-Rechner mit vorhandenem ACPI und UEFI sowie die erste Erfolgsmeldung des Windows-Tests klang vielversprechend, weshalb wir den Zhaoxin-Chip auch mit Linux testen wollen. Dazu nutzen wir das aktuelle Ubuntu 20.04 mit Langzeitunterstützung (LTS). Und zumindest der erste Start läuft problemlos, wir sehen den Bootloader Grub und dann läuft auch der Boot normal durch. Allerdings erblicken wir danach nicht wie erwartet den Login-Bildschirm, sondern lediglich einen blinkenden Cursor.

Wir wechseln also auf eines der virtuellen Terminals und sehen uns in dem Ubuntu-System um, bis sich der genutzte Linux-Kernel 5.4 mit einem Absturz verabschiedet. Wie eine kurze Recherche bestätigt, sollte die Zhaoxin-CPU eigentlich mit dieser Kernel-Version unterstützt werden. Wir entscheiden uns trotzdem für eine Aktualisierung auf den aktuellen Linux-Kernel 5.6 - mit Erfolg.

Gute Linux-Grafik nur über Umwege

Mit der aktuellen Linux-Kernel-Version können wir das System problemlos nutzen, sogar mit der grafischen Oberfläche. Hier zeigt sich jedoch ein weiteres Problem mit dem Chip, denn für die integrierte GPU auf Basis einer S3-Grafikeinheit gibt es keinen Treiber. Zwar gibt es und gab es in der Vergangenheit immer wieder Versuche der Linux-Community dahingehend, aber wirklich weit fortgeschritten sind diese nicht. Hinzu kommt auch die fehlende Unterstützung für diese Arbeiten durch den Hersteller selbst.

Unser 3D-Desktop läuft deshalb zunächst mit dem Software-Rasterizer LLVMpipe aus dem Mesa-Projekt, was zwar überraschend gut funktioniert, aber die sowieso schon geringe Leistung des Systems weiter drückt. Wir testen deshalb auch noch den PCIe-Steckplatz mit einigen bei uns verfügbaren Grafikkarten.

Der Erfolg ist hier offenbar abhängig davon, ob und inwiefern das UEFI des Systems die Karte überhaupt erkennt und zum Starten bewegen kann. Mit einer Radeon RX 480 funktioniert dies aber schließlich und wir können die Grafikbeschleunigung der AMD-Treiber unter Linux nutzen. Auch der Rest der Peripherie - wie USB oder Ethernet - läuft in unseren Tests problemlos.

Zhaoxin KX-U6780A: Verfügbarkeit, Fazit, Ausblick

Wir haben unsere Cjoyin-C1888-Platine samt KX-U6780A bei Taobao gekauft, am Ende summierten sich alle Kosten auf rund 700 Euro. Das ist viel Geld rein für ein Board - einen NUC9 (June Canyon) mit Atom/Pentium J5005 gibt es für 170 Euro. In China gibt es weitere Platinen sowie Mini-PCs, zudem vertreibt HP den 268 Pro G1 (PDF), auch Lenovo sowie Tongfang bieten Systeme an.

Fazit

Den KX-U6780A von Zhaoxin zu testen, hat uns von Anfang an fasziniert. Denn während wir von AMD und von Intel vorab zu neuen Prozessoren oft Monate und Wochen im Voraus detaillierte Informationen erhalten, ist zu den KX-6000 technisch wenig bekannt. Der grobe Aufbau des Chips lässt sich zwar durch Messungen erfassen, anders als bei der x86-Konkurrenz können wir dadurch aber kaum auf die tatsächliche Geschwindigkeit der CPU schließen.

Verglichen mit einem Atom-Chip und erst recht mit einem Core-basierten Pentium fällt die Performance des KX-U6780A niedrig aus. Im Mittel ist er so schnell wie Ersterer, gegen Letzteren bleibt er chancenlos. Das liegt primär an der niedrigen Leistung pro Takt, die noch unterhalb der eines aktuellen Atoms rangiert. Die acht Kerne helfen zwar, viele Anwendungen sind jedoch bis heute auf eine hohe Singlethread-Leistung angewiesen. Als einfacher Büro-Prozessor funktioniert der KX-U6780A allerdings tadellos.

https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-00.jpg
Zhaoxins ZX-U6780A (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-02a.jpg
Links der Die-Shot eines KX-5000, ein KX-6000 dürfte ähnlich aussehen. Recht die internen Kern-zu-Kern-Latenzen. (Bild: Zhaoxin)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-03.PNG
CPU-Details zum ZX-U6780A (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-04.jpg
Cjoyin C1888 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-05.jpg
Cjoyin C1888 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-06.jpg
Cjoyin C1888 (Bild: Golem.de)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-07.png
Roadmap mit KX-7000 (Bild: Zhaoxin via Wikichip)
https://scr3.golem.de/screenshots/2005/Zhaoxin-ZX-U6780A-Review/thumb620/Zhaoxin-ZX-U6780A-Review-07a.jpg
Erwartete Performance-Zuwachs bei Single- und Multithreading (Bild: Zhaoxin)

Ausblick

Zhaoxin arbeitet längst an den KX-7000 alias ZX-F für 2021. Die nutzen weiterhin acht Kerne, sollen aber Big- statt Little-Cores sein. Die Chinesen wollen die Leistung pro Takt um mehrere Faktoren steigern und auch einen DDR5-Speichercontroller integrieren, was durch TSMCs 7-nm-Verfahren unterstützt wird. Ein 15-Watt-SoC mit vier Kernen bei mindestens 2 GHz samt integrierter DX12-Grafik für leichte Notebooks steht ebenso auf der Roadmap wie eine schnelle Server-CPU namens KH-40000 mit 32 Threads. Wir sind jedenfalls sehr gespannt, was Zhaoxin in Zukunft veröffentlichen wird!

An dieser Stelle noch ein Danke an Anandtech für einen neueren GPU-Treiber und ein Danke an Loeschzwerg für die Messwerte des Eden C4650.

Nachtrag vom 29. Mai 2020, 17:24 Uhr

In einer früheren Version des Textes hatten wir geschrieben, dass schon die ZX-B vier Kerne hätten, es sind aber Dualcores.