Intel e SambaNova unem forças para competir com a parceria Groq da NVIDIA em soluções de inferência de IA.

Intel e SambaNova unem forças para competir com a parceria Groq da NVIDIA em soluções de inferência de IA.

No cenário em constante evolução da inteligência artificial (IA), as soluções de inferência estão ganhando cada vez mais atenção dos provedores de computação. Após a recente parceria entre a NVIDIA e a Groq, a comunidade de IA reconheceu a necessidade urgente de uma abordagem diversificada que vá além das GPUs tradicionais.É nesse contexto que surge a colaboração entre a Intel e a SambaNova.

Os processadores Xeon 6 da Intel servirão como plataforma para sistemas agentes, com o chip SN50 da SambaNova para inferência.

Durante o recente evento GTC da NVIDIA, o conceito de inferência desagregada ganhou destaque, com a fabricante enfatizando a mudança de uma abordagem puramente centrada em GPUs. Essa estratégia envolve a incorporação de uma variedade de unidades de computação avançadas em sua infraestrutura. Essa evolução é evidenciada pelo acordo de licenciamento com a Groq, que integrou LPUs baseadas em SRAM aos racks LPX da Rubin. A Intel e a SambaNova decidiram explorar territórios semelhantes, apresentando uma inovadora “arquitetura de inferência” que combina as RDUs da SambaNova com as CPUs Xeon 6 da Intel.

A SambaNova anunciou a fase mais recente de sua colaboração com a Intel: uma solução de hardware heterogênea que combina GPUs para tarefas de pré-preenchimento, processadores Intel® Xeon® 6 como hosts e CPUs de “ação”, e RDUs da SambaNova para decodificação, com o objetivo de fornecer inferência superior para aplicações de IA Agética exigentes.

– SambaNova

Essa parceria colaborativa foi estrategicamente projetada para otimizar cargas de trabalho, com RDUs dedicadas a tarefas de decodificação, enquanto GPUs gerenciam os processos de pré-carregamento e CPUs Xeon 6 cuidam da orquestração e das tarefas gerais de computação. Notavelmente, essa parceria não vincula um hiperescalador específico para soluções de GPU, abrindo espaço para potencial integração com ASICs. No entanto, a SambaNova não detalhou as métricas de desempenho específicas para GPUs nessa configuração. A empresa reconhece as unidades SN50 como fundamentais para alcançar “fluxos de trabalho de agentes de codificação de ponta a ponta”, afirmando sua superioridade em relação às alternativas ARM.

Uma pessoa segura um chip semicondutor com o texto visível "sambanova", etiquetado como "CEREBRAS 500K M2019-05" e "TITANIUM".
Créditos da imagem: SambaNova

Agora, vamos analisar os detalhes do chip SN50. Anunciada no início de 2026, essa solução apresenta as unidades RDU de quinta geração da SambaNova, integrando tecnologias de memória avançadas, incluindo DRAM, SRAM e HBM. Com uma capacidade substancial de 2 TB de memória DDR5, 64 GB de HBM3 e 520 MB de SRAM, essa arquitetura foi projetada para minimizar a latência e maximizar a taxa de transferência e a capacidade. De acordo com a SambaNova, a combinação exclusiva de DRAM, SRAM e HBM facilita o que eles chamam de “cache ativo”, proporcionando uma vantagem competitiva em eficiência de processamento.

Um gráfico comparativo intitulado "Panorama: Oferecendo Inferência Premium nas Maiores Cargas de Trabalho" mostrando dados para as soluções Intel, NVIDIA e Cerebras.
Captura de tela

Ao comparar as estratégias da Intel e da SambaNova com as da NVIDIA, surge uma distinção notável. A parceria da Intel tende a uma abordagem mais pragmática, minimizando a necessidade da extensa infraestrutura subjacente normalmente exigida para inferência desagregada. Isso torna a solução Intel-SambaNova atraente para hiperescaladores que buscam uma oferta modular em escala de rack que resolva efetivamente a divisão “pré-carregamento + decodificação”.

Além disso, o CEO da Intel participou ativamente da última rodada de financiamento da SambaNova, juntamente com Lip-Bu Tan, um dos primeiros investidores da empresa. Embora tenham ocorrido discussões sobre uma possível aquisição, elas teriam sido interrompidas devido a divergências no conselho, o que levou a Intel a optar por participar como investidora.

Fonte e imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *