O Google firma parceria com a Marvell em estratégia de TPU de dois chips com o objetivo de transformar a inferência de IA para ASICs.

Relatórios recentes indicam que o Google está colaborando com a Marvell para desenvolver dois chips inovadores: um dedicado a aprimorar as Unidades de Processamento de Tensores (TPUs) existentes e o outro representando um design de TPU de próxima geração.

Google e Marvell colaboram no desenvolvimento de chips de IA de última geração.

Segundo uma reportagem do The Information, as discussões entre o Google e a Marvell foram iniciadas, com foco na criação de dois chips especializados destinados a otimizar a inferência de IA.

Embora os detalhes sobre o andamento dessas discussões ainda sejam escassos, é evidente que o Google propôs dois chips distintos: um para aprimorar as TPUs atuais e outro como uma arquitetura de TPU completamente nova. Isso sugere que existe um plano fundamental para o desenvolvimento de ambos.

A finalidade dos dois chips diverge significativamente. O primeiro chip, relacionado à TPU, não será um silício personalizado, mas sim uma unidade de processamento de memória (MPU) projetada para funcionar em conjunto com uma TPU. Espera-se que essa MPU inovadora alivie parte da demanda de memória normalmente imposta ao chip ou sistema, facilitando assim um processamento em memória mais eficiente.

Um close-up reflexivo de uma lasca quadrada com a etiqueta Ironwood e um fundo desfocado com efeito bokeh.

O segundo chip em discussão representa uma TPU de última geração, projetada especificamente para modelos de inferência de IA. Atualmente, o principal acelerador de IA do Google é a TPU v7 ou série Ironwood, que possui especificações impressionantes, incluindo 192 GB de memória de alta largura de banda (HBM) e um desempenho máximo de 4614 TFLOPs. Essa poderosa TPU está integrada ao Superpod, que consiste em 9216 chips.

À medida que esses desenvolvimentos se desenrolam, prevemos que as futuras TPUs do Google, em conjunto com as novas MPUs, aprimorarão significativamente o subsistema de memória. Espera-se que essa melhoria leve a um desempenho mais rápido e eficiente dos modelos de IA, particularmente na área de inferência de IA.

Fonte e imagens