
NVIDIA a récemment dévoilé sa superpuce GB10 de pointe, qui utilise l’architecture GPU Blackwell, alimentant les derniers supercalculateurs DGX AI Mini.
NVIDIA GB10 Superchip : une architecture SoC et GPU révolutionnaire
Sous les projecteurs, le DGX Spark de NVIDIA, système pionnier équipé de la superpuce GB10, marque une entrée significative sur le marché des PC IA. Suite à son annonce, de nombreuses entreprises ont commencé à développer leurs propres plateformes PC IA exploitant la technologie GB10. Lors de la conférence Hot Chips 2025, NVIDIA a présenté en détail la superpuce GB10, démontrant comment elle adapte efficacement l’architecture Blackwell aux mini-stations de développement et aux stations de travail.

Le DGX Spark a été conceptualisé pour servir de mini supercalculateur d’IA, construit autour de l’architecture avancée Blackwell.

Principales caractéristiques de la station de travail DGX Spark
La station de travail DGX Spark intègre plusieurs fonctionnalités exceptionnelles :
- GB10 Grace Blackwell Superchip : optimisé pour les tâches d’IA, de science des données, de calcul, de rendu et de visualisation.
- Mémoire système unifiée cohérente de 128 Go : capable de gérer de grands modèles d’IA avec jusqu’à 200 milliards de paramètres et des modèles de réglage fin avec jusqu’à 70 milliards de paramètres.
- Mise en réseau ConnectX-7 : facilite l’interconnexion entre deux systèmes DGX Spark, permettant la collaboration sur des modèles jusqu’à 405 milliards de paramètres.
- DGX Base OS et NVIDIA AI Software Stack : cela garantit un transfert fluide des charges de travail entre DGX Spark et DGX Cloud ou toute infrastructure cloud accélérée.
- Options de déploiement polyvalentes : peut être configuré comme un poste de travail IA ou un cloud IA personnel connecté au réseau.
- Expérience utilisateur améliorée : offre une prise en charge des écrans multi-têtes et diverses options de connectivité.
- Conception compacte et économe en énergie : s’adapte confortablement à n’importe quel bureau et fonctionne avec une prise murale standard.

Plongée plus profonde : spécifications de la superpuce GB10
En examinant de plus près la superpuce GB10, nous constatons que son système sur puce (SoC) est conçu avec deux dielets : le S-Dielet, qui abrite le processeur et le sous-système mémoire, et le G-Dielet, dédié au cœur du GPU. Les deux dielets utilisent la technologie de packaging 2.5D avancée et sont fabriqués selon le procédé 3 nm de pointe de TSMC.

L’architecture du processeur repose sur la conception ARM v9.2, avec un total de 20 cœurs, configurés en deux clusters. Chaque cœur bénéficie d’un cache L2 dédié et d’un cache L3 collectif de 32 Mo partagé entre les clusters.

La partie GPU de la puce, exploitant l’architecture GB100 Blackwell, fonctionne comme un GPU intégré (iGPU) grâce à son intégration au sein du même boîtier. Elle bénéficie de fonctionnalités avancées, notamment des cœurs Tensor de 5e génération compatibles DLSS 4 et des cœurs RTX Ray Tracing, offrant une capacité de calcul impressionnante allant jusqu’à 31 TFLOPs pour les opérations FP32 et 1 000 TOPS pour les opérations NVFP4 (FP4), adaptées aux applications d’IA. De plus, le GPU intègre un cache L2 de 24 Mo pour optimiser les performances.
En termes de capacités mémoire, la superpuce NVIDIA GB10 prend en charge 256 bits LPDDR5x (architecture mémoire unifiée) avec des vitesses d’accès atteignant 9 400 MT/s, ce qui se traduit par une bande passante brute remarquable pouvant atteindre 301 Go/s. Cette configuration permet une capacité mémoire maximale de 128 Go. Sa structure cohérente hautes performances est optimisée pour le protocole de cohérence CHI-E, fournissant au GPU une bande passante système globale étendue de 600 Go/s via l’interface C2X.

De plus, le GB10 dispose d’un cache système de 16 Mo, conçu comme L4 pour le processeur, ce qui favorise un partage de données économe en énergie entre plusieurs moteurs SoC. L’interface C2C à large bande passante et basse consommation exploite la technologie NVLINK de NVIDIA.
Les options de connectivité sont robustes, avec la prise en charge des ports PCIe, USB et Ethernet sur PCIe. La puce peut gérer jusqu’à quatre écrans simultanément (3 DisplayPort + 1 HDMI) avec des résolutions allant jusqu’à 4K à 120 Hz en mode DP Alt, et prend même en charge la 8K à 120 Hz avec HDMI 2.1a. La sécurité est également au cœur de ses préoccupations, avec la prise en charge du Dual Secure Root, un processeur SROOT, un processeur OSROOT et une compatibilité avec les modules fTPM et TPM discrets. La puce affiche une puissance totale de conception (TDP) de 140 W.

Évolutivité de la superpuce GB10
Une autre caractéristique remarquable de la superpuce GB10 est son évolutivité. Plusieurs puces GB10 peuvent être interconnectées grâce à la technologie ConnectX de NVIDIA, ce qui améliore le débit, la bande passante et les capacités DRAM, essentiels à la prise en charge de modèles d’IA plus volumineux. Chaque carte d’interface réseau (NIC) ConnectX se connecte au SoC GB10 via une interface PCIe Gen5 x8, les unités communiquant via une infrastructure Ethernet.

NVIDIA décrit le SoC GB10 Superchip comme un partenariat réussi avec Mediatek, utilisant la propriété intellectuelle du processeur de Mediatek. La puce a fait l’objet d’une modélisation détaillée des performances des interactions entre la mémoire GPU et l’infrastructure mémoire de Mediatek.

Perspectives d’avenir de la superpuce GB10
L’aspect le plus prometteur de la superpuce GB10 réside dans son potentiel d’accès aux marchés grand public, tels que les ordinateurs portables et les mini-PC. Des rapports suggèrent que les futurs SoC N1X et N1 pourraient être les premiers SoC NVIDIA destinés au grand public, le GB10 offrant un aperçu des capacités potentielles de ces puces.
Laisser un commentaire