NVIDIA afirma que la adquisición de Groq mejorará la arquitectura como acelerador de decodificación de baja latencia, similar a Mellanox

La industria está en plena efervescencia con debates sobre las futuras estrategias de NVIDIA para la tecnología LPU (Unidad de Procesamiento Latente) de Groq. Durante la reciente presentación de resultados del cuarto trimestre de 2026, el director ejecutivo Jensen Huang insinuó avances emocionantes, anticipando una evolución significativa en el panorama tecnológico de NVIDIA.

LPU Groq de NVIDIA: Fortaleciendo el liderazgo en entornos sensibles a la latencia

NVIDIA ha emprendido una agresiva estrategia de adquisiciones este año, marcada especialmente por una alianza monumental con Groq, valorada en hasta 20 000 millones de dólares. Este acuerdo de no licencia, revelado en Nochebuena, aún no se ha detallado en detalle. Sin embargo, durante la presentación de resultados, Jensen Huang ofreció información sobre cómo las LPU de Groq podrían integrarse con las futuras iniciativas de IA de NVIDIA.

Con respecto a cómo pensamos sobre Groq y el decodificador de baja latencia, tengo algunas ideas geniales que me gustaría compartir con ustedes en GTC.

Y lo que haremos con Groq es que verán GTC, pero lo que haremos es extender nuestra arquitectura con Groq como acelerador de la misma manera que extendimos la arquitectura de NVIDIA con Mellanox.

– Jensen Huang, director ejecutivo de NVIDIA

El objetivo principal de la adquisición de Groq es abordar las cargas de trabajo sensibles a la latencia, un desafío apremiante en el panorama informático actual, especialmente en la inferencia de IA. A medida que la IA continúa evolucionando, la demanda de velocidades de respuesta ultrarrápidas convierte la latencia en un factor crítico para los proveedores de servicios. Si bien NVIDIA ha destacado en el ámbito del entrenamiento con sus arquitecturas Hopper y Blackwell, busca un mayor dominio en la inferencia mediante su próxima tecnología Vera Rubin, donde las unidades LPU de Groq se posicionan como un elemento clave en esta estrategia.

Huang comparó la importancia de Groq con la anterior adquisición de Mellanox, que resolvió importantes obstáculos de red para la empresa. Las contribuciones de Mellanox facilitaron un diseño conjunto exhaustivo para las estrategias de centros de datos de NVIDIA. De igual forma, Groq está listo para mejorar la arquitectura de NVIDIA mediante la posible integración de LPU a escala de rack, reforzando así su posición en el sector de la IA.

Una persona está de pie en el escenario mostrando varias unidades de servidor abiertas con sistemas de refrigeración y componentes de hardware visibles. — Créditos de la imagen: NVIDIA

En IA, la decodificación y el prellenado son etapas cruciales de la inferencia, y la decodificación se vuelve cada vez más vital en entornos multiagente. A medida que los sistemas de IA se interconectan más, la capacidad de decodificar información de forma rápida y eficaz es esencial. NVIDIA busca aprovechar las LPU Groq para mejorar esta capacidad. La integración de la tecnología SRAM en la matriz, que ofrece un ancho de banda interno asombroso, ya está causando sensación, como se observa en las implementaciones de empresas como Cerebras y Microsoft.

Existen interesantes posibilidades para la integración de las LPU de Groq en la arquitectura de NVIDIA. Una teoría predominante sugiere que NVIDIA podría crear nodos de cómputo híbridos con múltiples LPU conectadas mediante una interconexión unificada, lo que mejoraría la eficiencia computacional.

Imágenes una al lado de la otra de un semiconductor denominado 'LPU' y otro denominado 'GPU', que detallan sus intrincados circuitos.

Según analistas de GF Securities ( vía Jukan ), NVIDIA podría revelar un «rack LPX» en el próximo evento GTC, que podría incluir hasta 256 unidades LPU en una sola configuración. Los analistas especulan que la empresa podría emplear un protocolo plesiosíncrono nativo para la comunicación interna de las LPU, junto con NVLink Fusion para facilitar el manejo robusto de los datos de la GPU durante la inferencia.

Una vista detallada de una placa de servidor con componentes etiquetados que incluyen 'CPU', 'GPU', 'NVLink Fusion' y 'LPU', con — Representación preliminar de la bandeja de cómputo híbrida LPU de NVIDIA | Créditos de la imagen: Wccftech

En definitiva, las LPU de Groq tienen el potencial de replicar el impacto transformador de Mellanox en las redes, lo que permitirá a NVIDIA obtener una ventaja competitiva en aplicaciones sensibles a la latencia. Huang indicó que tanto la potencia de cálculo como los ingresos se encuentran actualmente en una trayectoria ascendente, impulsados por la rápida evolución de las aplicaciones de IA. Los analistas esperan con entusiasmo el lanzamiento oficial de estos avances durante la próxima conferencia GTC.

Fuente e imágenes