Relatórios recentes indicam que o Google está colaborando com a Marvell para desenvolver dois chips inovadores: um dedicado a aprimorar as Unidades de Processamento de Tensores (TPUs) existentes e o outro representando um design de TPU de próxima geração.
Google e Marvell colaboram no desenvolvimento de chips de IA de última geração.
Segundo uma reportagem do The Information, as discussões entre o Google e a Marvell foram iniciadas, com foco na criação de dois chips especializados destinados a otimizar a inferência de IA.
Embora os detalhes sobre o andamento dessas discussões ainda sejam escassos, é evidente que o Google propôs dois chips distintos: um para aprimorar as TPUs atuais e outro como uma arquitetura de TPU completamente nova. Isso sugere que existe um plano fundamental para o desenvolvimento de ambos.
A finalidade dos dois chips diverge significativamente. O primeiro chip, relacionado à TPU, não será um silício personalizado, mas sim uma unidade de processamento de memória (MPU) projetada para funcionar em conjunto com uma TPU. Espera-se que essa MPU inovadora alivie parte da demanda de memória normalmente imposta ao chip ou sistema, facilitando assim um processamento em memória mais eficiente.

O segundo chip em discussão representa uma TPU de última geração, projetada especificamente para modelos de inferência de IA. Atualmente, o principal acelerador de IA do Google é a TPU v7 ou série Ironwood, que possui especificações impressionantes, incluindo 192 GB de memória de alta largura de banda (HBM) e um desempenho máximo de 4614 TFLOPs. Essa poderosa TPU está integrada ao Superpod, que consiste em 9216 chips.
À medida que esses desenvolvimentos se desenrolam, prevemos que as futuras TPUs do Google, em conjunto com as novas MPUs, aprimorarão significativamente o subsistema de memória. Espera-se que essa melhoria leve a um desempenho mais rápido e eficiente dos modelos de IA, particularmente na área de inferência de IA.
Deixe um comentário