Projet Battlematrix d’Intel : une mise à jour logicielle majeure pour les GPU Arc Pro présente LLM Scaler v1.0, augmentant les performances jusqu’à 80 % avec un support amélioré

Projet Battlematrix d’Intel : une mise à jour logicielle majeure pour les GPU Arc Pro présente LLM Scaler v1.0, augmentant les performances jusqu’à 80 % avec un support amélioré

Intel a lancé une mise à jour logicielle importante pour son initiative Arc Pro « Project Battlematrix », introduisant le LLM Scaler v1.0 avec des améliorations notables.

Les GPU Intel Arc Pro bénéficient d’une importante mise à niveau logicielle avec LLM Scaler v1.0

Lors du Computex 2025, Intel a présenté le projet Battlematrix, ainsi que ses nouveaux GPU Arc Pro. Cette initiative vise à fournir une solution complète pour les plateformes de stations de travail d’inférence utilisant plusieurs GPU Arc Pro. Dans sa feuille de route produit, Intel s’est engagé à déployer le premier conteneur avec des fonctionnalités telles que le staging vLLM et la prise en charge de la télémétrie de base au troisième trimestre. Cet engagement s’est concrétisé avec la sortie de LLM Scaler v1.0.

Le projet Battlematrix d'Intel pour les GPU Arc Pro reçoit sa première mise à jour logicielle majeure : LLM Scaler v1.0

Le conteneur LLM Scaler v1.0 intègre un ensemble complet de fonctionnalités et d’optimisations :

  • Améliorations de vLLM :
    • Amélioration des performances jusqu’à 1, 8x pour une longueur de séquence de 40 K sur les modèles KPI de 32 B et 4, 2x pour les modèles KPI de 70 B
    • Augmentation d’environ 10 % du débit de sortie pour les modèles KPI 8B-32B par rapport à la version précédente
    • Quantification en ligne par couche pour des besoins réduits en mémoire GPU
    • Prise en charge expérimentale du parallélisme de pipeline (PP) dans vLLM
    • Fonctionnalités expérimentales, notamment torch.compile et le décodage spéculatif
    • Prise en charge de l’intégration et du reclassement des modèles
    • Compatibilité améliorée des modèles multimodaux
    • Détection automatique de la longueur d’entrée maximale
    • Fonctionnalité de parallélisme des données
  • Activation de l’outil d’évaluation OneCCL
  • Fonctionnalités de XPU Manager :
    • Surveillance de l’alimentation du GPU
    • Mises à jour du micrologiciel du GPU
    • Diagnostics GPU
    • Analyse de la bande passante mémoire du GPU

Intel souligne que la pile logicielle mise à jour est conçue pour être conviviale et conforme aux normes du secteur. Adapté aux environnements Linux, ce conteneur offre un potentiel de gain de performances allant jusqu’à 80 % grâce à la mise à l’échelle multi-GPU et aux transferts de données P2P PCIe. De plus, il offre une fiabilité et des fonctionnalités de gestion de niveau entreprise, notamment ECC, SR-IOV, la télémétrie et les mises à jour de firmware à distance.

Selon la feuille de route d’Intel, cette version sera bientôt suivie d’un lancement de conteneurs plus robuste plus tard ce trimestre, axé sur des performances améliorées et le service vLLM. Enfin, un ensemble complet de fonctionnalités est prévu pour le quatrième trimestre.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *