NVIDIA lancia le GPU AI “Rubin CPX” con 128 GB di memoria GDDR7 per attività di inferenza di alto valore

NVIDIA lancia le GPU AI “Rubin CPX” con 128 GB di memoria GDDR7 per attività di inferenza di alto valore

NVIDIA ha fatto notizia con l’introduzione di una serie rivoluzionaria di GPU AI note come chip Rubin CPX AI, progettate per offrire eccezionali capacità di inferenza quando utilizzate in una configurazione cluster su scala rack.

GPU Rubin CPX di NVIDIA: un nuovo benchmark nelle prestazioni AI su scala rack

Riconoscendo la crescente importanza dell’inferenza AI nei progressi computazionali, NVIDIA ha intrapreso un nuovo percorso con la sua gamma “CFX”.Il prodotto inaugurale, la serie Rubin, è stato presentato durante l’ AI Infra Summit. Destinata principalmente ad applicazioni AI a lungo contesto, la GPU Rubin CPX è destinata a integrare le GPU Rubin e le CPU Vera esistenti, annunciando quella che NVIDIA descrive come una “rivoluzione” nell’efficienza dell’inferenza AI.

Rubin CPX vanta specifiche impressionanti, tra cui 30 petaFLOP di potenza di calcolo NVFP4 e 128 GB di memoria GDDR7 all’avanguardia. Sarà integrato nel rack NVIDIA Vera Rubin NVL144 CPX appositamente progettato, che ospiterà 144 GPU Rubin CPX, 144 GPU Rubin e 36 CPU Vera, raggiungendo complessivamente l’incredibile cifra di otto exaFLOP di potenza di calcolo NVFP4. Questo rappresenta un significativo aumento di 7, 5 volte rispetto al sistema Blackwell Ultra e mira a gestire carichi di lavoro di inferenza AI contestuale da un milione di token con prestazioni migliorate grazie a innovazioni come Spectrum-X Ethernet.

Vassoio di elaborazione Vera Rubin NVL144 CPX con etichette Rubin, Vera, Rubin CPX, ConnectX-9 su sfondo nero.

Si prevede che questa piattaforma offra un notevole ritorno sull’investimento da 30 a 50 volte superiore, posizionando il rack Vera Rubin NVL144 CPX come uno strumento essenziale per superare le attuali limitazioni nello sviluppo di applicazioni di intelligenza artificiale generativa di nuova generazione. Sebbene siano previste ulteriori configurazioni del Rubin CPX, i dettagli non sono ancora stati divulgati. Tuttavia, l’integrazione di memoria GDDR7 al posto di HBM suggerisce una soluzione più conveniente per molti utenti.

NVIDIA sta navigando abilmente tra le complessità del panorama dell’intelligenza artificiale, riducendo al minimo le possibilità di vantaggio dei concorrenti. L’imminente lancio della gamma Rubin AI di nuova generazione, previsto per il prossimo anno, promette di portare le capacità di calcolo a livelli senza precedenti.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *