Cloudera AI Inference Service met ingebedde NVIDIA NIM-microservices voor snellere ontwikkeling en implementatie van GenAI
Cloudera introduceert Cloudera AI Inference, aangestuurd door NVIDIA NIM-microservices, onderdeel van het NVIDIA AI Enterprise-platform. Als een van de eerste services voor AI-inferentie die ingebouwde NIM-microservicemogelijkheden biedt, stroomlijnt Cloudera AI Inference de implementatie en het beheer van grootschalige AI-modellen. Daarmee kunnen organisaties het volledige potentieel van hun data benutten, om GenAI van pilotfases naar het operationeel gebruik te brengen.
Gevoelige data beschermen
Cloudera AI Inference beschermt gevoelige data tegen lekken naar niet-private, door leveranciers gehoste AI-modelservices, door veilige ontwikkeling en implementatie onder de controle van de eigen organisatie te bieden. De nieuwe service wordt aangestuurd door NVIDIA-technologie en helpt bij het bouwen van vertrouwde data voor vertrouwde AI met hoge verwerkingssnelheden. Dit maakt efficiënte ontwikkeling van AI-gestuurde chatbots, virtuele assistenten en agentische applicaties mogelijk, wat zowel de productiviteit als de groei van organisaties beïnvloedt.
Samenwerking met NVIDIA
Ontwikkelaars kunnen zakelijke LLM's bouwen, aanpassen en implementeren, met tot 36x snellere verwerking door NVIDIA Tensor Core GPUs. Tot de belangrijke functies van Cloudera AI Inference behoren:
- Geavanceerde AI-mogelijkheden: gebruik NVIDIA NIM-microservices om open-source LLM's, waaronder LLama en Mistral, te optimaliseren voor geavanceerde ontwikkelingen in natuurlijke taalverwerking (NLP), computer vision en andere AI-domeinen.
- Hybride cloud en privacy: verwerk workloads on-prem of in de cloud, met VPC-implementaties voor verbeterde beveiliging en naleving van regelgeving.
- Schaalbaarheid en monitoring: vertrouw op automatische schaalbaarheid, hoge beschikbaarheid (HA) en realtime prestatietracking, om problemen te detecteren en te corrigeren en efficiënt resourcebeheer.
- Open API's en CI/CD-integratie: krijg toegang tot API's die voldoen aan standaarden voor de implementatie, beheer en monitoring van modellen voor naadloze integratie met CI/CD-pipelines en MLOps-workflows.
- Zakelijk beveiligingsniveau: dwing toegang tot modellen af met functies voor service-accounts, toegangscontrole, lineage en auditing.
- Risicobeheerde implementatie: voer A/B-testen en canary-uitrol uit voor gecontroleerde modelupdates.
"Bedrijven willen graag investeren in GenAI, maar dat vereist niet alleen schaalbare data, maar ook veilige, compliant en goed beheerde data", aldus marktanalist Sanjeev Mohan. "Het op grote schaal in gebruik nemen van AI introduceert complexiteit die DIY-benaderingen moeilijk kunnen aanpakken. Cloudera AI Inference biedt uitkomst door geavanceerd databeheer te integreren met de AI-expertise van NVIDIA, waardoor het volledige potentieel van data te ontsluiten is en tegelijkertijd wordt beschermd. Met zakelijke beveiligingsfuncties zoals service-accounts, toegangscontrole en audit kunnen organisaties hun data met vertrouwen beschermen en workloads on-prem of in de cloud uitvoeren. Zo worden AI-modellen efficiënt geïmplementeerd met de benodigde flexibiliteit en governance."
"Bedrijven moeten tegenwoordig generatieve AI naadloos integreren met hun bestaande infrastructuur aan data, om de resultaten te stimuleren", aldus Kari Briski, vice president van AI-software, modellen en services bij NVIDIA. "Door NVIDIA NIM-microservices op te nemen in Cloudera's AI Inference-platform, stellen we ontwikkelaars in staat om eenvoudig betrouwbare generatieve AI-applicaties te maken en tegelijkertijd een zelfvoorzienend AI-datavliegwiel te faciliteren".
Meer over
Lees ook
SAP en Databricks lanceren Business Data Cloud voor AI-gedreven besluitvorming
SAP lanceert vandaag de SAP Business Data Cloud, een innovatief platform dat in samenwerking met Databricks is ontwikkeld. Dit platform integreert zowel SAP- als externe data binnen een organisatie, waardoor bedrijven beschikken over een solide databasis voor betere besluitvorming en betrouwbare AI-toepassingen.
Eerste rapportages ECCO
Het European Cloud Competition Observatory (ECCO) heeft zijn eerste rapporten gepubliceerd. ECCO is opgericht door CISPE om toezicht te houden op de implementatie van het Memorandum of Understanding van juli 2024 tussen CISPE en Microsoft en om oneerlijke softwarelicentiepraktijken op de markt aan het licht te brengen.
Havenbedrijf Rotterdam waarborgt bedrijfsprocessen met SAP S/4HANA Cloud
Het Havenbedrijf Rotterdam heeft een belangrijke stap gezet in zijn digitale transformatie. Samen met partner myBrand Conclusion werd SAP ECC met behulp van RISE with SAP gemigreerd naar SAP S/4HANA. Met deze overstap beschikt de organisatie over een flexibele en toekomstbestendige ERP-omgeving die innovatie ondersteunt en processen optimaliseert.