Google s’associe à Marvell pour une stratégie TPU à deux puces visant à transformer l’inférence IA pour les ASIC.

Google s’associe à Marvell pour une stratégie TPU à deux puces visant à transformer l’inférence IA pour les ASIC.

Des rapports récents indiquent que Google collabore avec Marvell pour développer deux puces innovantes, l’une dédiée à l’amélioration des unités de traitement tensoriel (TPU) existantes, et l’autre représentant une conception de TPU de nouvelle génération.

Google et Marvell collaborent sur des puces d’IA de nouvelle génération

Selon un article de The Information, des discussions ont débuté entre Google et Marvell, axées sur la création de deux puces spécialisées destinées à optimiser l’inférence de l’IA.

Bien que les détails concernant l’avancement de ces discussions restent rares, il est clair que Google a proposé deux puces distinctes : l’une destinée à améliorer les TPU actuelles et l’autre constituant une architecture TPU entièrement nouvelle. Cela laisse supposer qu’un plan de base est en place pour leur développement.

Les deux puces ont des finalités très différentes. La première, liée à l’unité TPU, ne sera pas une puce sur mesure, mais une unité de traitement de la mémoire (MPU) conçue pour fonctionner conjointement avec une TPU. Cette MPU innovante devrait alléger la charge mémoire habituellement imposée à la puce ou au système, permettant ainsi un traitement en mémoire plus efficace.

Gros plan réfléchissant d'une puce carrée étiquetée Ironwood avec un arrière-plan flou (effet bokeh).

La seconde puce évoquée est une TPU de nouvelle génération, conçue spécifiquement pour les modèles d’inférence d’IA. Actuellement, l’accélérateur d’IA phare de Google est la TPU v7, également connue sous le nom de série Ironwood, qui offre des performances impressionnantes, notamment 192 Go de mémoire à large bande passante (HBM) et une puissance de calcul maximale de 4 614 TFLOPS. Cette puissante TPU est intégrée au Superpod, qui comprend 9 216 puces.

À mesure que ces évolutions se concrétisent, nous prévoyons que les futures TPU de Google, associées aux nouvelles MPU, amélioreront considérablement le sous-système de mémoire. Cette amélioration devrait permettre d’obtenir des performances plus rapides et plus efficaces pour les modèles d’IA, notamment en matière d’inférence.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *