Raja Koduri rejoint le conseil consultatif de SanDisk sur la mémoire flash à large bande passante pour atteindre une capacité 8 à 16 fois supérieure pour les GPU IA à 4 To, ce qui est rentable par rapport à HBM

Raja Koduri rejoint le conseil consultatif de SanDisk sur la mémoire flash à large bande passante pour atteindre une capacité 8 à 16 fois supérieure pour les GPU IA à 4 To, ce qui est rentable par rapport à HBM

Raja Koduri a assumé un rôle clé chez SanDisk, visant à piloter le développement de la mémoire Flash à haut débit (HBF).Cette innovation vise à améliorer les capacités d’intelligence artificielle (IA) en remédiant aux limites de la mémoire Flash à haut débit traditionnelle (HBM), souvent confrontée à des contraintes de capacité.

Nomination stratégique de Raja Koduri au conseil consultatif de SanDisk sur la mémoire HBF

Raja Koduri, ancien architecte en chef d’Intel et retraité de la division graphique du géant technologique en 2023, se consacre désormais à l’augmentation de la capacité VRAM des GPU IA. Sa récente annonce de rejoindre le conseil consultatif technique de SanDisk témoigne de son engagement en faveur du développement de la technologie de mémoire HBF, qui promet des améliorations significatives de la capacité mémoire des GPU IA de nouvelle génération.

La collaboration de Raja avec SanDisk est remarquable en raison de sa vaste expérience en développement de GPU et en architectures de calcul. Cette synergie s’inscrit parfaitement dans la volonté de SanDisk de développer une technologie HBF qui pallie les inconvénients inhérents à la technologie HBM.

Diagramme de pile Flash à bande passante élevée améliorant la mémoire HBM avec flash NAND pour les charges de travail d'IA.
La pile HBF peut fournir une capacité de mémoire plusieurs fois supérieure tout en conservant la même bande passante que HBM.

Lorsque nous avons commencé le développement de HBM, notre priorité était d’améliorer la bande passante par watt et par mm² (deux contraintes importantes pour le mobile), tout en maintenant une capacité compétitive par rapport aux solutions existantes. Avec HBF, l’objectif est d’augmenter significativement la capacité mémoire (par dollar, par watt et par mm²) tout en offrant une bande passante compétitive.

Raja Koduri

Malgré les avancées rapides du HBM, qui a permis d’offrir d’importantes capacités de mémoire aux superpuces centrées sur l’IA, le HBF a le potentiel d’accroître exponentiellement les capacités mémoire grâce à la technologie Through-Silicon Vias. Une seule pile HBF peut offrir une capacité mémoire de l’ordre du téraoctet, et l’intégration de huit piles de ce type dans un système permet aux GPU d’IA d’atteindre jusqu’à 4 To de VRAM tout en conservant les caractéristiques de bande passante élevée offertes par le HBM. Ce développement est crucial pour répondre aux exigences croissantes des applications d’IA.

Il est essentiel de comprendre que la technologie HBF de SanDisk ne concurrencera pas directement la DRAM pour les tâches sensibles à la latence. Elle est conçue pour répondre aux besoins mémoire des opérations d’IA, telles que l’inférence et l’entraînement de modèles à grande échelle, qui privilégient la capacité et la bande passante à la latence. Le rôle stratégique de Raja sera déterminant dans le développement de cette solution mémoire haute capacité.

Comparaison entre les capacités de mémoire GPU HBM et HBF.Représentation visuelle des capacités de mémoire du GPU : 192 Go HBM contre 4 096 Go HBF.Exécution de Frontier LLM avec HBF : paramètres 1, 8 T, poids 16 bits et 3 600 Go de mémoire pour le GPU.

Alors que SanDisk vise à faire de HBF un framework à norme ouverte, cette initiative devrait favoriser une adoption généralisée au sein du secteur. Le réseau remarquable de Raja et son expérience dans la création d’écosystèmes seront précieux pour renforcer les collaborations avec les fabricants de GPU.

HBF s’apprête à révolutionner l’IA en périphérie de réseau en dotant les appareils de capacités mémoire et de bande passante permettant l’exécution locale et en temps réel de modèles sophistiqués. Cette avancée ouvrira la voie à une nouvelle ère d’applications intelligentes en périphérie de réseau, transformant fondamentalement les modalités et les lieux d’inférence de l’IA.

– Raja Koduri

Pour plus de détails, visitez l’annonce officielle de SanDisk.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *