Alla scoperta di NVIDIA Vera Rubin: uno dei sistemi di intelligenza artificiale più complessi al mondo con un milione di componenti integrati

Alla scoperta di NVIDIA Vera Rubin: uno dei sistemi di intelligenza artificiale più complessi al mondo con un milione di componenti integrati

NVIDIA ha avviato la produzione su larga scala della sua architettura Vera Rubin di nuova generazione, fornendo un’analisi approfondita del suo complesso design del sistema rack e dei componenti chiave.

Alla scoperta di Vera Rubin di NVIDIA: chip aggiornati, raffreddamento a liquido avanzato e NVLink 6 di fascia alta

L’introduzione di Vera Rubin segna un significativo passo avanti nella tecnologia rack per NVIDIA. Recenti approfondimenti tratti da un video della CNBC ne illustrano l’architettura dettagliata, inclusi componenti come il nodo di elaborazione principale e i sistemi critici di rete e raffreddamento. In particolare, Dion Harris, Senior Director of Infrastructure di NVIDIA, ha descritto il sistema Vera Rubin come uno dei “sistemi di intelligenza artificiale più complessi al mondo”, evidenziando la natura complessa della sua implementazione.

Poiché si prevedono a breve impegni da parte dei clienti per il sistema Vera Rubin, è fondamentale comprendere la struttura del rack NVL72. Un pilastro di questa architettura è il Vera Rubin SuperChip. Abbiamo già discusso le sue specifiche tecniche, sottolineando i notevoli progressi ottenuti integrando HBM4 con la GPU, completata da moduli SOCAMM specializzati. Questa innovazione si traduce in un’impressionante larghezza di banda di memoria di 1, 2 TB/s.

Primo piano di un chip NVIDIA contrassegnato con 'B_KR 2546-P' e 'E6A382. OA2 e1' su un circuito stampato.

Vera Rubin introduce anche significativi aggiornamenti nella tecnologia di raffreddamento, con design modulari per il raffreddamento a liquido che supportano i componenti SuperChip come la GPU Rubin e la CPU Vera tramite cold plate dedicate. La leadership di NVIDIA afferma che questo approccio di raffreddamento innovativo invoglierà gli operatori hyperscale ad adottare sistemi di raffreddamento a liquido più avanzati. Inoltre, i design attuali promuovono un ridotto consumo di acqua, accentuando un altro vantaggio ambientale.

Primo piano di un rack per server con più componenti visibili su un tavolo nero, caratterizzato da un telaio metallico e da un sistema di raffreddamento.Una persona che tiene in mano i componenti interni di un dispositivo elettronico senza marchio, che mette in mostra numerose connessioni.

La tecnologia NVLink è un altro componente fondamentale della configurazione Vera Rubin NVL72. Con la sua interconnessione di sesta generazione, comunemente nota come “NVLink Spine”, NVIDIA mira a offrire una notevole larghezza di banda totale di 260 TB/s per rack. Harris sottolinea che questa ultima versione di NVLink eleva il design modulare, facilitando la manutenzione senza tempi di inattività e una maggiore affidabilità attraverso servizi RAS a livello di rack.

Un circuito stampato che mostra più chip NVIDIA con dissipatori di calore verdi e componenti circostanti.

Sebbene le prime proiezioni indichino che il sistema Vera Rubin potrebbe avere un prezzo più elevato, NVIDIA assicura che questa architettura consente una riduzione di 10 volte dei costi dei token di inferenza e di 4 volte del numero di GPU necessarie per l’addestramento dei modelli Mixture of Experts (MoE) rispetto al Blackwell GB200. Ciò è in linea con la filosofia del CEO di NVIDIA secondo cui maggiori investimenti generano maggiori risparmi.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *