NVIDIA ha presentado su última solución informática para hiperescaladores: Blackwell Ultra. Las pruebas de rendimiento recientes del GB300 NVL72 revelan su excepcional rendimiento, especialmente en aplicaciones de baja latencia y contexto extenso.
Racks Blackwell Ultra AI de NVIDIA: rendimiento agente mejorado gracias a los avances de NVLink
El panorama de la IA ha experimentado cambios transformadores desde su auge en 2022, con un énfasis notable en la computación agente, impulsada por aplicaciones y marcos avanzados. Para proveedores de infraestructura como NVIDIA, la necesidad de un alto ancho de banda de memoria y un alto rendimiento es fundamental para satisfacer las estrictas demandas de latencia de estos sofisticados sistemas. Su serie Blackwell Ultra responde eficazmente a este desafío. En una evaluación reciente compartida por NVIDIA a través de una entrada de blog, Blackwell Ultra obtuvo resultados excepcionales en el benchmark InferenceMAX de SemiAnalysis.

NVIDIA destaca una métrica crucial, denominada «token/vatio», fundamental en el desarrollo de hiperescaladores actual. El enfoque en las mejoras tanto del rendimiento bruto como del rendimiento es evidente, con la GB300 NVL72 logrando un notable aumento de 50 veces en el rendimiento por megavatio en comparación con las GPU Hopper de la generación anterior. Una comparación ilustrativa muestra el estado de implementación óptimo de cada arquitectura.
¿Cómo logra NVIDIA unas ganancias de rendimiento tan asombrosas? La respuesta reside en su vanguardista tecnología NVLink. El Blackwell Ultra cuenta con una configuración de 72 GPU que se unifica en una única estructura NVLink, ofreciendo una impresionante conectividad de 130 TB/s. En cambio, la serie Hopper utiliza un diseño NVLink de 8 chips que, si bien es efectivo, no se ajusta a la innovadora arquitectura y diseño del Blackwell Ultra. Además, la introducción del formato de precisión NVFP4 es crucial, consolidando el dominio del GB300 en términos de rendimiento.

Con el auge de la IA agente, las evaluaciones de NVIDIA del GB300 NVL72 también enfatizan el costo de los tokens, junto con las mejoras mencionadas. Team Green reporta una reducción significativa de 35 veces en el costo por millón de tokens, lo que posiciona a este sistema como la opción preferida para tareas de inferencia entre laboratorios de vanguardia e hiperescaladores. Dado que las leyes de escalado continúan evolucionando a un ritmo sin precedentes, NVIDIA atribuye estas mejoras de rendimiento a su estrategia de codiseño extremo, junto con lo que ahora se conoce como la Ley de Huang.

Al comparar el GB300 NVL72 con la serie Hopper, es fundamental reconocer las sutiles diferencias en los nodos de cómputo y los diseños arquitectónicos. NVIDIA también ha comparado el GB200 con el GB300 NVL72 para evaluar el rendimiento de cargas de trabajo de contexto largo. Las limitaciones contextuales siguen siendo un factor importante para los agentes, ya que la gestión de una extensa base de código puede aumentar exponencialmente el uso de tokens. Con Blackwell Ultra, NVIDIA puede reportar costos por token hasta 1, 5 veces menores y un procesamiento de atención dos veces más rápido, lo que lo hace excepcionalmente adecuado para tareas centradas en agentes.
A medida que Blackwell Ultra comienza a integrarse en entornos de hiperescalado, estos benchmarks representan algunas de las primeras evaluaciones de esta arquitectura. Los resultados iniciales sugieren que NVIDIA ha mantenido un escalado de rendimiento robusto, alineado con las aplicaciones de IA contemporáneas. Además, con avances futuros como los que se esperan de Vera Rubin, la generación Blackwell podría impulsar a NVIDIA aún más hacia adelante en el competitivo panorama de infraestructuras.
Deja una respuesta