01/06/2026
Mellum a commencé comme un modèle de complétion de code.
Mellum2 va bien au-delà de cet usage.
Désormais open source sur Hugging Face Mellum2 est conçu pour les flux de travail modernes d'IA appliqués à l'ingénierie logicielle, notamment le routage, le RAG (génération augmentée par récupération), les sous-agents, la synthèse de contenu et les tâches d'inférence en temps réel.
Sa nouvelle architecture Mixture of Experts (MoE) est optimisée pour offrir une inférence à très faible latence et de hautes performances, ce qui la rend adaptée aux déploiements en production à grande échelle.
Pourquoi les équipes s'intéressent à Mellum2 :
• Inférence efficace pour les charges de travail en temps réel
• Hautes performances et fort débit en production
• Options de déploiement local et auto-hébergé
• Contrôle total de l'infrastructure et des données
Disponible dès maintenant sous licence Apache 2.0.
En savoir plus :
Entraîné à partir de zéro et conçu pour un déploiement pratique, Mellum2 est conçu pour le routage, les questions-réponses, les sous-agents et l'utilisation de l'IA privée dans les systèmes d'ingénier