Los chips de inferencia de Groq superan a los de Blackwell de NVIDIA en un factor de 5 en eficiencia de costes y ofrecen resultados el doble de rápido.

Los chips de inferencia de Groq superan a los de Blackwell de NVIDIA en un factor de 5 en eficiencia de costes y ofrecen resultados el doble de rápido.

El panorama de la computación de inteligencia artificial (IA) está evolucionando rápidamente, según las ideas compartidas por un experto de Nebius, proveedor líder de infraestructura informática, durante una conversación con AlphaSense. A medida que se expanden las capacidades de computación de IA, NVIDIA continúa dominando la industria con sus unidades de procesamiento gráfico (GPU) avanzadas. Sin embargo, están surgiendo alternativas, especialmente a medida que el mercado modifica sus modelos de precios.

Surgen alternativas a los chips de NVIDIA en un contexto de cambios en los parámetros de costes.

La dinámica de precios en el sector de la infraestructura de IA está influenciada por el tipo de GPU utilizada y por si la capacidad se reserva con antelación o se requiere bajo demanda. Por ejemplo, las GPU H100 de NVIDIA tienen una tarifa de 2, 95 dólares por hora para la capacidad bajo demanda, mientras que su variante más reciente, la H200, cuesta 3, 50 dólares por hora. Las últimas Blackwell B200 tienen un precio que oscila entre 4, 90 y 6, 50 dólares por hora.

Por el contrario, cuando las organizaciones optan por capacidad reservada durante un período contractual de uno a dos años —con un compromiso de al menos 10 000 GPU— los costos disminuyen significativamente. Con este acuerdo, los precios se fijan en 1, 50 $ por hora para las H100, 2, 20 $ para las H200 y un mínimo de 3, 50 $ para las B200. Esta drástica reducción de costos subraya las ventajas estratégicas de los contratos a largo plazo para la gestión de los gastos operativos.

GPU NVIDIA H200

El cambio empresarial: la inferencia y el auge de los precios basados ​​en tokens.

En un avance significativo, NVIDIA firmó un acuerdo de licencia clave con Groq a finales de 2025, el mayor acuerdo hasta la fecha, que refuerza su enfoque en la tecnología de inferencia de IA. Según los datos del experto de Nebius, la inferencia representa actualmente entre el 90 % y el 95 % de la carga de trabajo empresarial. Este cambio refleja la creciente tendencia de las organizaciones a utilizar modelos preentrenados y API en lugar de desarrollar software propietario.

Además, esta transición del entrenamiento a la inferencia exige una reevaluación exhaustiva de las estructuras de costos en la infraestructura de IA. El experto destacó que este panorama en constante evolución no es simplemente una tendencia, sino que representa un cambio fundamental en la forma en que las empresas evalúan y despliegan sus recursos informáticos.

Coste por millón de tokens: Análisis comparativo de NVIDIA y Groq

A medida que las empresas adoptan esta nueva estructura de costos, la fijación de precios por token —específicamente por millón de tokens— se ha vuelto cada vez más común. Cabe destacar que los chips de Groq ofrecen una opción más económica, con un precio de entre cinco y diez centavos por millón de tokens. En contraste, las ofertas de NVIDIA, como las B100, B200 o B300, tienen un precio considerablemente más alto, de 25 centavos por millón de tokens.

Además de su rentabilidad, los chips de Groq superan a las alternativas de NVIDIA en velocidad, con una capacidad de procesamiento de hasta 800 tokens por segundo, casi el doble de los 450 tokens por segundo que ofrecen las GPU de NVIDIA. Esta combinación de precio asequible y rendimiento posiciona a Groq de forma competitiva en el mercado.

Métrico NVIDIA (Blackwell B200) Groq LPU
Costo (por 1 millón de tokens) $0.25 $0.10 (60% más barato)
Rendimiento (tokens/seg) 450 800 (77% más rápido)
Carga de trabajo principal Entrenamiento pesado / Empresa Inferencia de alta velocidad

Para obtener más detalles, consulte la fuente original.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *