SoftBank prevede che le GPU AMD miglioreranno le capacità dell’intelligenza artificiale attraverso la strategia di elaborazione “Dividi et impera”

SoftBank ha lanciato un ambizioso progetto volto a migliorare le prestazioni dei chip Instinct AI di AMD, specificamente per le applicazioni di intelligenza artificiale. Questa iniziativa impiega una tecnica di “partizionamento della GPU” all’avanguardia che ha suscitato notevole interesse nella comunità tecnologica.

SoftBank implementa un orchestratore personalizzato per le GPU Instinct di AMD

Sebbene l’infrastruttura di intelligenza artificiale di AMD non abbia recentemente catturato l’attenzione degli hyperscaler, in particolare a causa del predominio di NVIDIA e della recente presentazione della serie Blackwell, aziende come SoftBank sono ancora interessate a sfruttare la tecnologia AMD. Come annunciato in un recente post sul blog, la divisione tecnologica di SoftBank ha introdotto un Orchestrator che si integra perfettamente con i chip di intelligenza artificiale Instinct di AMD. Questo sistema alloca dinamicamente le risorse di calcolo in base alle esigenze del carico di lavoro e alla disponibilità delle risorse.

In collaborazione con AMD, SoftBank ha sviluppato una funzionalità Orchestrator avanzata che sfrutta le capacità di partizionamento delle GPU AMD Instinct™, consentendo di utilizzare una singola GPU come più dispositivi logici. Questa funzionalità consente l’allocazione flessibile e ottimale delle risorse GPU in base ai requisiti dell’applicazione di intelligenza artificiale, come le dimensioni del modello e la concorrenza.

– SoftBank

Dal punto di vista tecnico, Orchestrator di SoftBank enfatizza l’efficiente distribuzione del carico di lavoro all’interno delle GPU Instinct di AMD. Sfruttando più istanze GPU configurate su singoli Accelerator Complex Die (XCD), può operare in diverse modalità, tra cui un modello a istanza singola (SPX) e configurazioni che supportano fino a otto istanze (CPX).Questa versatilità offre un elevato livello di granularità tra diversi carichi di lavoro. Inoltre, Orchestrator sfrutta appieno le ampie capacità di memoria di AMD, segmentando la memoria a larghezza di banda elevata (HBM) in regioni distinte per ciascuna istanza GPU.

Un diagramma intitolato "SoftBank Orchestrator: ottimizzazione delle risorse GPU AMD" confronta "Prima: allocazione monolitica" e "Dopo:" — Crediti immagine: SoftBank

Con questo Orchestrator, SoftBank mira a ottenere un controllo raffinato sulle risorse di calcolo, garantendo un rigoroso isolamento a livello hardware per mitigare i problemi di latenza imprevedibili. Sebbene non siano ancora state rese note specifiche metriche prestazionali, SoftBank afferma che il suo approccio migliora “l’allocazione ottimale delle risorse”, a vantaggio in particolare dei carichi di lavoro SLM e MLM. In futuro, l’azienda prevede di adattare tali orchestrator ad altri acceleratori di intelligenza artificiale, ma per il momento l’attenzione rimane sulla tecnologia AMD.

Fonte e immagini