Google se asocia con Marvell en una estrategia de TPU de dos chips con el objetivo de transformar la inferencia de IA para ASIC.

Informes recientes indican que Google está colaborando con Marvell para desarrollar dos chips innovadores: uno dedicado a mejorar las unidades de procesamiento tensorial (TPU) existentes y otro que representa un diseño de TPU de próxima generación.

Google y Marvell colaboran en chips de IA de próxima generación.

Según un informe de The Information, Google y Marvell han comenzado las conversaciones centradas en la creación de dos chips especializados destinados a optimizar la inferencia de IA.

Si bien aún se desconocen los detalles sobre el progreso de estas conversaciones, es evidente que Google ha propuesto dos chips distintos: uno para mejorar las TPU actuales y otro con una arquitectura de TPU completamente nueva. Esto sugiere que existe un plan fundamental para su desarrollo.

El propósito de ambos chips difiere significativamente. El primero, relacionado con la TPU, no será un chip de silicio personalizado, sino una unidad de procesamiento de memoria (MPU) diseñada para funcionar conjuntamente con una TPU. Se espera que esta innovadora MPU alivie parte de la carga de memoria que normalmente recae sobre el chip o el sistema, facilitando así un procesamiento en memoria más eficiente.

Primer plano reflectante de una ficha cuadrada etiquetada como Ironwood con un fondo bokeh difuminado.

El segundo chip que se analiza es una TPU de última generación, diseñada específicamente para modelos de inferencia de IA. Actualmente, el acelerador de IA insignia de Google es la TPU v7 o serie Ironwood, que cuenta con especificaciones impresionantes, incluyendo 192 GB de memoria de alto ancho de banda (HBM) y un rendimiento máximo de 4614 TFLOPs. Esta potente TPU está integrada en el Superpod, que consta de 9216 chips.

A medida que se desarrollen estos avances, prevemos que las próximas TPU de Google, junto con las nuevas MPU, mejorarán significativamente el subsistema de memoria. Se espera que esta mejora se traduzca en un rendimiento más rápido y eficiente de los modelos de IA, especialmente en el ámbito de la inferencia de IA.

Fuente e imágenes

Los ingresos locales de Apple por el programa LLM se ven afectados por el retraso en el lanzamiento del Mac Studio M5 Ultra y la venta de configuraciones anteriores.

Los precios de la memoria DDR5 en Alemania se disparan hasta el 410% de los precios de julio, frustrando las expectativas de una bajada de precios en marzo.