28/05/2026
Le GPU hanno costi di gestione significativi e l'ottimizzazione di uno stack di GenAI su Kubernetes richiede un approccio strategico alla gestione delle risorse.
Insieme ad Akamas, abbiamo organizzato un webinar per approfondire questo tema.
🎙 Il triangolo dell'ottimizzazione della GenAI: bilanciare costi, latenza e accuratezza su Kubernetes
📅 3 giugno 🕒 15.00
Stefano Doni si confronterà con Daniele Zonca e Roland Huß (co-autori del libro "Generative AI on Kubernetes") in una sessione tecnica dedicata alle reali sfide di ottimizzazione che i team di platform engineering e gli ingegneri AI affrontano oggi:
🌐 Dimensionamento corretto dell'infrastruttura GPU;
🌐 Riduzione dei costi nei processi di inference serving;
🌐 Importanza dei framework di tracciamento e valutazione degli agenti.
👉 Iscriviti ora! https://bit.ly/akamas-redhat-webinar