Arista levert holistische AI-oplossingen in samenwerking met NVIDIA

JU-Blog-AI-Center

AI-agent voor optimale coördinatie van GPU- en netwerkprestaties

Arista Networks heeft AI-datacentertechnologie aangekondigd, in samenwerking met NVIDIA, om computer- en netwerkdomeinen op één lijn te brengen als één beheerde AI-entiteit. Voor het bouwen van optimale generatieve AI-netwerken die taken sneller verwerken, kunnen klanten AI-clusters op een uniforme wijze configureren, beheren en monitoren. Dat kan vanaf nu over alle belangrijke bouwstenen, waaronder netwerken, NIC's en servers. Deze demonstratie van nieuwe technologie is de eerste stap richting een multi-vendor, interoperabel ecosysteem dat controle en coördinatie tussen AI-netwerken en AI-computers mogelijk maakt.

Behoefte aan uniforme controles

Naarmate AI-clusters en grote taalmodellen (LLM’s) groeien, groeit ook de complexiteit en het volume van andere delen van de totale AI-puzzel. GPU's, NIC's, switches, optics en kabels moeten optimaal samenwerken om een holistisch netwerk te vormen. Klanten hebben uniforme controles nodig tussen hun AI-servers die NIC’s en GPU’s hosten, en de AI-netwerkswitches op verschillende niveaus.

Alle elementen zijn van elkaar afhankelijk voor een correcte verwerking van AI-taken, maar werken in de praktijk onafhankelijk van elkaar. Dit kan leiden tot een verkeerde configuratie of verkeerde afstemming tussen onderdelen van het hele ecosysteem, zoals tussen NIC's en switches. Met als mogelijk gevolg een ongewenste impact op de voltooiing van taken in de tijd, omdat netwerkproblemen moeilijk te diagnosticeren kunnen zijn. Grote AI-clusters vereisen tevens gecoördineerd congestiebeheer om pakketverliezen en onderbenutting van GPU’s te voorkomen, evenals gecoördineerd beheer en monitoring om de computer- en netwerkbronnen tegelijkertijd te kunnen optimaliseren.

Introductie van de Arista AI-agent

De kern van de AI-oplossing is een op Arista EOS gebaseerde agent waarmee het netwerk en de host onderling kunnen communiceren en configuraties kunnen coördineren om AI-clusters te optimaliseren. Met behulp van een externe AI-agent is het EOS op Arista-switches uit te breiden naar rechtstreeks aangesloten NIC's en servers, om één centraal punt van controle en zichtbaarheid in een AI-datacenter mogelijk te maken als holistische oplossing.

De externe AI-agent die direct op een NVIDIA BlueField-3 SuperNIC wordt gehost, of op de server draait en telemetrie van de SuperNIC verzamelt, stelt EOS in staat om op de netwerkswitch netwerkproblemen op de server te configureren, te monitoren en te debuggen, voor end-to-end netwerkconfiguratie en QoS-consistentie. AI-clusters zijn daardoor als één homogene oplossing te beheren en te optimaliseren.

End-to-end AI-communicatie en -optimalisatie

De nieuwe technologie laat zien hoe een op Arista EOS gebaseerde externe AI-agent het mogelijk maakt het gecombineerde, onderling afhankelijke AI-cluster als één totaaloplossing te beheren. EOS die in het netwerk draait is uit te breiden naar servers of SuperNIC's via externe AI-agents, om onmiddellijke tracking en rapportage van prestatievermindering of storingen tussen hosts en netwerken mogelijk te maken. Met als gevolg dat de veroorzakers snel kunnen worden geïsoleerd om de impact te reduceren.

Omdat op EOS gebaseerde netwerkswitches continu op de hoogte zijn van de exacte netwerktopologie, maakt het uitbreiden van EOS tot SuperNIC's en servers met de externe AI-agent een gecoördineerde optimalisatie van end-to-end QoS tussen alle elementen in het AI-datacenter mogelijk. Daarmee is de verwerkingstijd van AI-taken aanzienlijk te verkorten.

Efficiëntie communicatie verbeteren

“Arista streeft ernaar de efficiëntie van de communicatie tussen het netwerk en de GPU-topologie te verbeteren om de verwerkingstijden van alle taken te verbeteren via een gecoördineerde orkestratie, configuratie, validatie en monitoring van rekenkracht versneld door NVIDIA SuperNICs en Arista-netwerkinfrastructuur”, zegt John McCool, Chief Platform Officier voor Arista Networks.

“De beste Arista-netwerkplatformen gecombineerd met NVIDIA’s computerplatformen en SuperNIC’s maken gecoördineerde AI-datacenters mogelijk. De nieuwe mogelijkheid om het Arista’s EOS uit te breiden met externe AI-agents op hosts belooft een oplossing te bieden bij een cruciale uitdaging van klanten met grootschalige AI-clusters. Dat is mogelijk door één centraal punt van controle en zichtbaarheid te bieden om de beschikbaarheid en prestaties van AI te beheren als een holistische oplossing”, zegt Zeus Kerravala, hoofdanalist bij ZK Research.

Lees meer over de nieuwe AI-datacenters in de blog van CEO en bestuursvoorzitter Jayshree Ullal.

 

Meer over
Lees ook
Confluent: datastreaming versnelt AI-ontwikkeling en bespaart kosten

Confluent: datastreaming versnelt AI-ontwikkeling en bespaart kosten

Confluent, Inc. pionier in datastreaming, heeft zijn 2024 Data Streaming report: Breaking Down the Barriers to Business Agility & Innovation uitgebracht. Het rapport onderzoekt de manier waarop organisaties datastreaming inzetten voor innovatie, het versnellen van AI-adoptie, het verbeteren van bedrijfsflexibiliteit en klantervaringen en het aanpa1

Pure Storage helpt klanten de snelle ontwikkeling van AI bij te houden

Pure Storage helpt klanten de snelle ontwikkeling van AI bij te houden

Pure Storage komt met nieuwe functionaliteiten voor het Pure Storage platform waarmee IT- en businessleiders AI optimaal kunnen inzetten. Ook wordt de cyberweerbaarheid verbeterd en is het mogelijk om applicaties te moderniseren. De verbeteringen zijn gepresenteerd op Pure//Accelerate in Las Vegas, de jaarlijkse Pure Storage conferentie.

Slechts 6% van de Benelux organisaties maakt momenteel gebruik van GenAI

Slechts 6% van de Benelux organisaties maakt momenteel gebruik van GenAI

Organisaties in de Benelux ervaren verschillende voordelen van generatieve AI (GenAI) en maar liefst 87 procent heeft de intentie om het komende jaar te investeren in de technologie. Dit blijkt uit het GenAI marktonderzoek van SAS, dat eerder dit jaar is uitgevoerd door Coleman Parkes Research Ltd.