
NVIDIA continúa generando revuelo en la industria tecnológica con sus últimos avances en renderizado neuronal y juegos, particularmente a través de su serie de GPU Blackwell RTX, que incluye RTX 5090 y RTX PRO 6000.
NVIDIA presenta las innovaciones de Blackwell RTX en Hot Chips 2025
Lanzada en enero de 2023, la arquitectura Blackwell RTX ha presentado características revolucionarias centradas principalmente en la inteligencia artificial (IA).Esta innovación no es nueva para NVIDIA, ya que su trayectoria comenzó con el lanzamiento de CUDA en 2006, lo que marcó un avance significativo en la computación acelerada y la IA.

NVIDIA afirma que los avances en densidad de cómputo han superado el escalado de la Ley de Moore, gracias a técnicas como Sparsity, una nueva Arquitectura de Conjunto de Instrucciones (ISA) y formatos optimizados de menor precisión. La introducción del trazado de rayos en tiempo real en 2018 y el lanzamiento de DLSS al año siguiente representan hitos cruciales en esta evolución.

Estas innovaciones se han logrado utilizando tecnologías avanzadas, incluidos núcleos RT y núcleos Tensor, y Blackwell ahora amplifica estas capacidades a un nuevo nivel.

En el ámbito de los centros de datos, NVIDIA introdujo la precisión FP4, que ofrece una mejora de cuatro veces para cargas de trabajo que requieren un escalado denso. Jensen Huang, CEO de NVIDIA, busca reafirmar el papel fundamental de la IA en los gráficos, facilitando el surgimiento de la era del renderizado neuronal con Blackwell RTX. La marca RTX representa innovación en simulación, creación de contenido y videojuegos, allanando el camino para extender las tecnologías de los centros de datos a las GPU RTX de consumo.

¿Qué aporta entonces la arquitectura Blackwell? Cuenta con avances como DLSS 4, MFG, ACE y Path Tracing mejorado, todos diseñados para acelerar el rendimiento y mejorar la fidelidad visual. NVIDIA afirma que Blackwell RTX puede lograr una amplificación de 10 veces en rendimiento, espacio ocupado y ciclo de diseño. DLSS 4 utiliza estratégicamente IA para renderizar el 100 % de los píxeles después del fotograma inicial, lo que se traduce en tiempos de renderizado más rápidos y una mayor duración de la batería para dispositivos móviles.

Los principios de diseño clave de la GPU RTX Blackwell incluyen:
- Optimización para nuevas cargas de trabajo neuronales
- Minimizar el uso de memoria
- Garantizar un servicio de calidad para tareas neuronales y gráficas
- Eficiencia energética escalable

A nivel técnico, RTX Blackwell es una potencia de ingeniería que ofrece 4000 Teraoperaciones por Segundo (TOPS) de IA y compatibilidad con FP4 de alta velocidad, basados en núcleos Tensor de 5.ª generación. Proporciona hasta 360 TFLOP de RT para megageometría con los núcleos RT de 4.ª generación, mientras que el Proceso de Gestión de IA (AMP) gestiona eficazmente los modelos de IA junto con el procesamiento gráfico.

La arquitectura del multiprocesador de transmisión RTX Blackwell (SM) difiere significativamente de la de su homólogo para centros de datos. Una mejora notable es la integración de las unidades FP32 e INT32, que anteriormente estaban separadas, lo que mejora la eficiencia del procesamiento.

Además, RTX Blackwell mejora el reordenamiento de ejecución de sombreadores (SER), duplicando la eficiencia de la ejecución de sombreadores.

El Tensor Core de quinta generación introduce compatibilidad con FP4 e incluye el modo MFG en DLSS 4, lo que permite que la GPU use IA para renderizar cuatro cuadros simultáneamente.

Como resultado, el uso de DLSS 4 junto con la generación de fotogramas reduce significativamente el tiempo de renderizado de cada fotograma, multiplicando por diez la velocidad de compuerta de los rieles del núcleo y logrando frecuencias de actualización automática de la DRAM 100 veces más rápidas. Las plataformas móviles pueden experimentar una reducción de hasta el doble en el consumo de energía de la GPU, lo que mejora considerablemente la duración de la batería.

La introducción de GDDR7 permite a la RTX Blackwell alcanzar velocidades de hasta 30 Gbps, duplicando la velocidad de datos de su predecesora, la GDDR6. Este nuevo estándar de memoria mejora aún más la eficiencia en plataformas móviles.
Gracias a la unidad AMP de NVIDIA, la ejecución simultánea de cargas de trabajo de IA y gráficos es una realidad, lo que genera una entrega de cuadros más fluida y respuestas del modelo más rápidas.

En la transición de las aplicaciones de juegos al uso profesional, NVIDIA incorpora nuevas funciones en la RTX PRO 6000, como Universal MIG. Esto permite que hasta cuatro GPU RTX PRO, cada una con 24 GB de VRAM, funcionen simultáneamente con una latencia y un rendimiento consistentes.
Una demostración impresionante mostró la capacidad de la RTX PRO 6000 al ejecutar cuatro instancias de Cyberpunk 2077 a 1080p con la configuración máxima, una tarea manejable para esta poderosa GPU.

Usando una instancia estándar con intervalos de tiempo como referencia, las comparaciones con los modos MIG 2x y 4x revelaron un notable aumento del 60 % en la escalabilidad. La GPU RTX PRO 6000 Blackwell es ideal para gestionar múltiples instancias de aplicaciones exigentes como Cyberpunk 2077.

En general, la arquitectura de GPU Blackwell de NVIDIA ha avanzado a pasos agigantados desde su lanzamiento, evolucionando continuamente tanto para aplicaciones de consumo como profesionales. A medida que más juegos y herramientas de creación de contenido incorporan las amplias mejoras neuronales y de IA que ofrece Blackwell, la expectación por los futuros desarrollos en este ámbito es palpable.
Deja una respuesta