Se revela la arquitectura de la GPU NVIDIA Blackwell RTX 50: detalles clave sobre núcleos avanzados, DLSS 4 y tecnologías de juegos de próxima generación

En el CES 2025, NVIDIA presentó en profundidad su arquitectura de GPU Blackwell de próxima generación, que impulsará las próximas tarjetas gráficas para juegos RTX 50. Este diseño innovador promete avances significativos con respecto a la arquitectura Ada anterior, mejorando el rendimiento, la eficiencia y las capacidades gráficas tanto para los jugadores como para los creadores de contenido.

Explorando la arquitectura de la GPU NVIDIA GeForce RTX 50 “Blackwell”

La arquitectura Blackwell está diseñada para entornos de juego de alta demanda y aplicaciones creativas, con componentes innovadores que facilitan un rendimiento superior. El lanzamiento de la serie RTX 50 está previsto para finales de este mes, con una arquitectura creada en el nodo de proceso de 4 nm de TSMC. Este diseño de GPU de vanguardia incorpora la impresionante cantidad de 92 mil millones de transistores, que ofrecen hasta 4000 TOPS de IA, 380 RT TFLOP y 125 TFLOPS de potencia de cómputo FP32. Además, cuenta con la interfaz de memoria GDDR7 más rápida, que logra anchos de banda de hasta 1,8 TB/s, todo ello alojado dentro de una estética Founders Edition rediseñada.

Descripción detallada de la arquitectura de Blackwell

La arquitectura Blackwell de NVIDIA tiene como objetivo elevar la destreza gráfica de la próxima generación de juegos centrándose en capacidades neuronales y cargas de trabajo avanzadas. Esto incluye una reducción sustancial en el uso de memoria, una eficiencia energética mejorada y características innovadoras de calidad de servicio. Las mejoras clave incluyen:

Introducción de núcleos Tensor de quinta generación, que ofrecen computación FP4 de alta velocidad con hasta 4000 TOPS de IA.
Núcleos de trazado de rayos (RT) de cuarta generación con unos asombrosos 360 RT TFLOP, diseñados específicamente para megageometría.
Un procesador de gestión de IA de próxima generación que permite sin problemas la ejecución simultánea de modelos de IA y cargas de trabajo gráficas.
Nuevos multiprocesadores Blackwell Streaming (SM) capaces de alcanzar 125 TFLOPS de cómputo FP32 máximo.
La inclusión de memoria GDDR7, que ofrece las velocidades más rápidas hasta la fecha, hasta 30 Gbps en la RTX 5080.

Las características adicionales de la arquitectura RTX Blackwell incluyen DisplayPort 2.1, compatibilidad con PCIe Gen5 y capacidades NVDEC/NVENC 4K con profundidad de color mejorada.

Mejoras de rendimiento y avances tecnológicos

Al comparar los multiprocesadores de transmisión (SM) de Blackwell con los de la arquitectura Ada, resulta evidente que NVIDIA ha duplicado efectivamente el rendimiento de la GPU INT32, mejorando el rendimiento de cargas de trabajo como Work Graphs y Shader Execution. La nueva arquitectura también permite una ejecución más eficiente de múltiples cargas de trabajo, mejorando significativamente el reordenamiento de la ejecución de sombreadores (SER) por un factor de dos.

Además, la memoria GDDR7 supera a la anterior memoria GDDR6/X en rendimiento, ofreciendo el doble de ancho de banda y velocidades de datos, y al mismo tiempo siendo más eficiente energéticamente. Esta innovadora tecnología de memoria es compatible con la señalización PAM4, lo que posiciona a la serie RTX 50 como la primera arquitectura capaz de aprovechar al máximo tanto la memoria GDDR7 como la PCIe 5.0.

Tecnologías avanzadas de trazado de rayos

Los avances arquitectónicos también se extienden al trazado de rayos. La introducción de los núcleos RT de cuarta generación incluye el motor Triangle Cluster Intersection Engine, optimizado específicamente para el procesamiento de Mega Geometry. Esta actualización permite un mejor manejo de escenas complejas y, al mismo tiempo, mantiene un menor consumo de memoria.

Además, el innovador motor Mega Geometry incorpora un formato de compresión de grupos de triángulos, que gestiona de forma eficiente los datos necesarios para tareas de trazado de rayos exhaustivas. Esto da como resultado una tasa de intersección de triángulos de rayos de 8x y, al mismo tiempo, minimiza el uso de memoria.

La introducción del formato FP4 en los núcleos Tensor de quinta generación de Blackwell ofrece un aumento espectacular del rendimiento, lo que proporciona una ventaja de rendimiento de 32 veces sobre las GPU Pascal y un aumento de 2 veces en comparación con las GPU de la generación Ada. Esta mejora admite técnicas avanzadas de sombreado neuronal que se utilizan en los títulos de juegos de próxima generación.

Programación innovadora y gestión de energía

Una incorporación importante dentro de la arquitectura Blackwell es el coprocesador programable conocido como Amp. Este componente facilita la interacción eficiente y la distribución de la carga de trabajo entre los distintos núcleos de la GPU, lo que garantiza un rendimiento óptimo.

Blackwell también adopta modos sofisticados de administración de energía, lo que permite que el árbol de reloj de la GPU se desactive durante los estados inactivos. Esta capacidad permite un ahorro de energía significativo, especialmente beneficioso para los diseños móviles, como la serie «Max-Q». La arquitectura mejora el rendimiento al tiempo que optimiza el consumo de energía a través de un riel secundario que permite operaciones con diferentes voltajes para los núcleos y los sistemas de memoria.

Además, Blackwell mejora su capacidad de respuesta en frecuencia en un notable factor de 1000, lo que permite una asignación eficiente de frecuencias en función del tipo de carga de trabajo. Esto genera una mejora de la frecuencia de reloj de hasta 300 MHz en comparación con las GPU Ada.

Capacidades de visualización y video

La arquitectura Blackwell también refuerza las capacidades de procesamiento de vídeo y visualización. Introduce compatibilidad con DisplayPort 2.1b, lo que mejora la entrega de fotogramas mediante técnicas avanzadas de medición de inversión de hardware. La arquitectura incluye el codificador de novena generación y el decodificador de sexta generación, compatibles con códecs avanzados como AV1 y HEVC, lo que garantiza una calidad y un rendimiento de vídeo de primer nivel.

Avances en DLSS: DLSS 4

Continuando con la evolución de la tecnología de aprendizaje profundo, DLSS 4 representa un avance significativo desde su creación en 2018. En esta iteración, NVIDIA aprovecha supercomputadoras avanzadas para mejorar continuamente el modelo DLSS, lo que da como resultado mejoras sustanciales en la calidad de la imagen y la capacidad de respuesta.

Con DLSS 4, NVIDIA realiza la transición a una nueva arquitectura neuronal sólida, que incluye un motor de transformación capaz de manejar múltiples conjuntos de datos de manera más eficaz. El nuevo modo de generación de múltiples cuadros (MFG) permite generar hasta cinco modelos por cuadro, lo que mejora significativamente la calidad de la representación.

Este enfoque innovador sienta las bases para que DLSS 4 esté disponible con soporte inicial para 75 juegos, la biblioteca más grande de títulos mejorados con DLSS lanzada simultáneamente. Los desarrolladores que ya utilizan DLSS 3 o 3.5 encontrarán una integración sencilla, lo que garantiza un soporte sólido tanto para las líneas de títulos nuevas como para las existentes.

Reducción de la latencia con Reflex 2

La tecnología Reflex 2 de NVIDIA tiene como objetivo mejorar la capacidad de respuesta de los jugadores, especialmente en entornos competitivos. Al utilizar la tecnología Frame Warp, Reflex 2 reduce la latencia del sistema en un 75 %, lo que mejora la experiencia de juego en general.

Esta mejora permite el muestreo en tiempo real de las posiciones del mouse antes de la renderización de los cuadros, lo que optimiza significativamente la capacidad de respuesta. Reflex 2 será compatible de forma nativa con varios títulos de alto rendimiento, lo que garantiza que todos los usuarios de GPU RTX puedan beneficiarse de este avance.

Revolucionando los juegos con RTX AI

La arquitectura Blackwell de NVIDIA enfatiza la integración de la IA en los juegos. Al colaborar con Microsoft para acceder a las capacidades de renderizado neuronal de DirectX, NVIDIA está preparada para ofrecer un rendimiento incomparable con las GPU RTX 50. Las innovaciones incluyen sombreadores neuronales y manejo avanzado de materiales, lo que promete un cambio transformador de los gráficos tradicionales a los gráficos impulsados por IA.

A través de nuevas tecnologías como Neural Radiance Cache (NRC) y RTX Mega Geometry, NVIDIA está redefiniendo la forma en que la luz interactúa con los objetos en una escena, ofreciendo un realismo y una interactividad incomparables en los entornos de juego. La introducción de funciones mejoradas por IA para la representación de personajes subraya aún más el compromiso de brindar detalles realistas a los mundos virtuales.

El futuro de los juegos se ve reforzado por las capacidades de Blackwell, con aplicaciones avanzadas en materiales neuronales y optimización de la iluminación que aumentarán drásticamente la fidelidad y la eficiencia visual. A medida que NVIDIA sigue avanzando, la comunidad de juegos puede esperar avances sin precedentes en el rendimiento gráfico y la integración de la IA.

Fuente e imágenes