Rome is gearriveerd: AMD server CPU’s met tot 64 cores

Met de Epyc processoren van de 7002 serie komt AMD nu met server processoren gebaseerd op de Zen 2 architectuur. Ontwikkeld onder de codenaam “Rome” vinden de processoren met maximaal 64 cores veel weerklank bij serverfabrikanten en de grote cloudproviders.

Met de Epyc-processor van de eerste generatie, de codenaam was “Naples”, wist AMD een krachtige en technisch interessante serverprocessor op de markt te brengen, maar de grote doorbraak bleef uit. Met “Rome”, de tweede generatie Epyc, zou dit nu kunnen veranderen. Een hele reeks fabrikanten heeft reeds servers of barebonesystemen en moederborden aangekondigd voor de nieuwe AMD CPU’s. De reden hiervoor is dat AMD er met de nieuwe Zen 2-architectuur in is geslaagd om tot 64 kernen op één CPU onder te brengen, terwijl deze toch compatibel blijft met de vorige socket. Intel heeft met de Cascade-Lake processor Xeon Platinum 9282 wel een CPU met 56 cores in zijn gamma. Maar het is extreem duur en alleen verkrijgbaar als een compleet dubbel-CPU-systeem, aangezien de processoren op het moederbord zijn gesoldeerd. Daarentegen zijn de AMD-processoren zelfs relatief goedkoop met een maximum van 6.950 US dollar.

64 cores en PCI-Express 4.0

In de eerste Epyc-generatie hadden de topmodellen 32 cores, verdeeld over vier dies met elk acht cores. De in totaal acht geheugenkanalen zijn verdeeld over de vier dies, die met elkaar verbonden zijn door een die-to-die Infinity fabric. Voor de nieuwe Zen2 Epyc-processoren heeft AMD een verfijnde chiplet-aanpak ontwikkeld die een centrale I/O- en geheugendobbelsteen combineert met maximaal acht kleine CPU-dobbelstenen die ook via een infinity fabric met elkaar zijn verbonden.

In de Epyc 7002 met 64 cores zijn er in totaal acht cores met 2x SMT en dus 16 threads in elk van de acht dies. Dit geeft de CPU een totaal van 64 cores en 128 threads. CPU’s met een kleiner aantal kernen kunnen dus gemakkelijk worden geproduceerd door een kleiner aantal CPU-chiplets te gebruiken. Bovendien bespaart het concept kosten omdat alleen de CPU-chiplets in het dure 7 nm-proces worden vervaardigd. De I/O-chiplet daarentegen is een 14-nm-apparaat. De concentratie van geheugencontrollers in I/O-chiplets verlaagt ook de NUMA-complexiteit in dual-CPU-systemen en daarmee de latency bij toegang tot het remote NUMA-domein.

Volgens AMD zijn de afzonderlijke cores ook sneller geworden. AVX2-bewerkingen kunnen nu in één klokcyclus worden verwerkt. Wat de Zen2-architectuur echter mist, in tegenstelling tot Intels huidige Cascade-Lake-generatie, zijn speciale instructies voor AI-toepassingen of ondersteuning van persistent geheugen.

AMD's Epyc 7702 maakt gebruik van een chiplet-ontwerp met een centrale matrijs voor I/O en de acht geheugenkanalen, evenals maximaal acht CPU-dies, elk met acht kernen.

De Epyc-7002-serie communiceert, net als de Naples Epyc, met de DDR4 ECC-modules via acht geheugenkanalen, maar ondersteunt twee keer zoveel geheugen met maximaal 4 TB per socket. De 128 PCI Express lanes, die ook PCIe 4.0 met verdubbelde snelheid ondersteunen, zijn een aanzienlijk voordeel ten opzichte van Intels Xeon-processoren. Bij Intel zijn er niet meer dan 96 PCIe 3.0 lanes beschikbaar, zelfs in een dual-CPU systeem met socketed processoren. Hierdoor kan de AMD-processor meer GPU’s of meer NVMe SSD’s ondersteunen, en dat ook nog eens met hogere prestaties.

De innovaties en technische details van de Epyc 7002 van de Rome-generatie in één oogopslag.

Een ander argument voor de Epyc-processoren ziet AMD in de hogere beveiliging van de nieuwe processoren, die niet alleen Secure Memory Encryption en Secure Encrypted Virtualization bieden, maar ook minder kwetsbaar zijn voor side-channel attacks. AMD is tot nu toe in ieder geval gespaard gebleven van gaten als Meltdown, Zombieload of Foreshadow. De Zen2 CPU’s zijn in principe beschermd tegen Spectre.

De tweede Epyc-generatie vindt gretigheid

Tijdens de presentatie van de Epyc-7002-serie kon AMD-baas Lisa Su al een ware lijst presenteren van bedrijven die computers met de nieuwe server AMD-processoren willen aanbieden, geschikte platforms willen fabriceren of ze in hun eigen datacenters willen gebruiken. HPE heeft complete servers met één of twee sockets aangekondigd. De single-CPU server HPE Proliant DL325 zou een bijzonder goede prijs-prestatieverhouding hebben en de dual-CPU server Proliant DL325 zou de meest energie-efficiënte server in zijn klasse zijn.

Lenovo stuurt als voorbode de Thinksystem modellen SR635 en SR655 als single-processor serverplatforms de race in. Zij zouden ook gekenmerkt worden door een zeer hoge energie-efficiëntie. Het 2U SR655-systeem biedt plaats aan maximaal zes grafische kaarten van één breedte om bijvoorbeeld als VDI-server te fungeren. Als alternatief kunnen tot 32 NVMe-schijven in de server worden gebruikt voor toepassingen die een opslagoplossing met hoge geheugenbandbreedte en lage latency vereisen. De SR635 kan maximaal 16 NVMe SSD’s bevatten, maar neemt slechts één hoogte-eenheid in het rack in beslag.

Systeemintegrators kunnen de basis voor hun eigen servers met Epyc-7002-processors vinden bij Asus of Supermicro. Asus heeft drie barebones voor rackservers in de 1U-vormfactor aangekondigd, de RS500A-E10-PS4, RS500A-E10-RS4 of RS500A-E10-RS12U, die eind september of begin oktober beschikbaar zouden moeten zijn. De PS4- en RS4-modellen hebben beide vier 3,5-inch schijfsleuven voor respectievelijk SATA- of SAS-HDD’s en SSD’s. Het RS4-model is uitgerust met een redundante stroomvoorziening. Het RS12U-model biedt plaats aan maximaal 12 NVMe SSD’s. Eind september is de beschikbaarheidsdatum voor het KRPA-U16 server moederbord. Het bord heeft één PCIe 4.0 slot met 24 lanes en één met acht lanes. Daarnaast is er een connector voor OCP 2.0 mezzanine netwerkkaarten, die ook verbonden is met de CPU via 16 PCIe 4.0 lanes. Supermicro’s H12-A+ serie omvat twee 1U-modellen voor een Epyc-7002 serie CPU en twee 2U-modellen, die elk plaats bieden aan twee nodes. Het 2U TwinPro 4-Node model kan zelfs twee Epyc-7002 processoren en 16 geheugenslots per node huisvesten. Wie het zonder deze kenmerken kan stellen, kan als alternatief een bestaand Supermicro H11 bord gebruiken voor een upgrade naar een Epyc processor van de tweede generatie. De socket is compatibel.

Onder de hyperscalers gebruiken Microsoft Azure en AWS al machines met Epyc-processors van de eerste generatie en zullen zij ook de nieuwe generatie in hun datacenters gebruiken. Google zal in eerste instantie servers met de nieuwe AMD CPU’s gebruiken in zijn interne datacenters en zal ze aan het eind van het jaar ook aanbieden aan cloud-klanten.

Met 19 modellen is de reeks Epyc-2 processoren beslist overzichtelijker dan Intels Xeons. Dit varieert van de acht-core 7232p tot de 7702 met 64 cores en de mogelijkheid van dual-CPU gebruik. De “P”-modellen zijn in principe alleen geschikt voor single-CPU-systemen.

Het modellengamma van de tweede generatie Epyc processoren strekt zich uit van de 7232P met acht cores tot de 7702 met 64 cores. De 7702P, die ook 64 cores heeft, verschilt van de aanzienlijk duurdere 7702 doordat deze geen ondersteuning biedt voor dual-socket systemen.