Rubin firmy NVIDIA integruje się z maszyną wirtualną Google, rozszerzając klastry wielostanowiskowe do prawie 1 miliona procesorów GPU

W ramach niezwykłej współpracy Google i NVIDIA łączą siły, aby zaoferować użytkownikom dostęp do nawet miliona procesorów graficznych NVIDIA. Inicjatywa ta jest częścią wprowadzenia na rynek nowych instancji A5X, których celem jest obniżenie kosztów wnioskowania i zwiększenie przepustowości tokenów. System A5X integruje zaawansowane akceleratory sieciowe firmy NVIDIA, tworząc podwaliny pod solidne, jedno- i wieloklastrowe infrastruktury obliczeniowe, zaprojektowane specjalnie dla obciążeń AI.

Przedstawiamy instancję A5X: dostosowaną do sztucznej inteligencji agentowej

Instancja A5X to najnowsze osiągnięcie Google, stworzone specjalnie z myślą o obciążeniach związanych ze sztuczną inteligencją opartą na agentach. Należy ona do rozwijającego się portfolio AI Hypercomputer, które stanowi podstawę platformy Google Gemini, obsługującej różnorodne aplikacje AI dla użytkowników indywidualnych i przedsiębiorstw. Ta nowa oferta wprowadza znaczące ulepszenia do Hypercomputer, oferując specjalnie zaprojektowane maszyny wirtualne oparte na niestandardowych procesorach ARM, procesorach Tensor ósmej generacji, natywną obsługę PyTorch TPU oraz, oczywiście, innowacyjne instancje A5X.

Zaprojektowane do obsługi scenariuszy AI opartych na agentach, instancje A5X wykorzystują kolektyw agentów AI, wdrażając metodologię fragmentaryczną w celu rozwiązywania złożonych problemów. Co istotne, te instancje są pierwszymi instancjami Google, które są kompatybilne z najnowocześniejszymi procesorami graficznymi Vera Rubin AI firmy NVIDIA.

Slajd prezentacji przedstawiający procesor graficzny Rubin i jednostkę LPU Groq 3 wraz ze specyfikacjami, obok osoby na scenie, pod hasłem „Łączenie procesorów o ekstremalnej wydajności”.

Google Virgo i ConnectX-9: skalowanie infrastruktury AI

Instancje A5X wykorzystają możliwości kart sieciowych (NIC) ConnectX-9 firmy NVIDIA, które zostały zaprojektowane z myślą o zwiększeniu obciążeń AI w środowiskach chmurowych wykorzystujących Ethernet. Ta synergia technologiczna, w połączeniu z platformą Virgo firmy Google, umożliwia użytkownikom wdrożenie do 80 000 procesorów graficznych Rubin w jednym klastrze oraz aż 960 000 procesorów graficznych w klastrach wielolokalizacyjnych.

Część	Maksymalny pojedynczy klaster centrów danych	Maksymalny klaster wielostanowiskowy
Procesory graficzne NVIDIA Vera Rubin	80 000	960 000
Niestandardowe procesory TPU firmy Google	134 000	1 000 000+
Szkielet sieciowy	Karty sieciowe NVIDIA ConnectX-9	Platforma Google Virgo

Osiąganie zwrotu z inwestycji: drastycznie obniżone koszty wnioskowania i zwiększona przepustowość

Platforma Google Virgo zapewnia bezprecedensową łączność między licznymi układami AI w jednym centrum danych. Ta solidna infrastruktura nie tylko współpracuje z procesorami graficznymi Vera Rubin firmy NVIDIA, ale także bezproblemowo integruje się z procesorami tensorowymi (TPU) firmy Google. Virgo może połączyć do 134 000 układów TPU w jednym centrum danych i ponad milion układów w wielu lokalizacjach. Co godne uwagi, NVIDIA twierdzi, że instancje A5X mogą zapewnić dziesięciokrotną redukcję kosztów wnioskowania na token, jednocześnie zwiększając przepustowość dziesięciokrotnie na megawat w porównaniu z wcześniejszymi modelami.

Ponadto NVIDIA podkreśla współpracę z liderami branży, takimi jak Cadence i Siemens, prezentując, jak ich produkty są zasilane przez tę infrastrukturę i dostępne za pośrednictwem Google Cloud. Co więcej, platforma Gemini firmy Google jest gotowa do wdrażania modeli agentowych i przepływów pracy w wielu sektorach, w tym w cyberbezpieczeństwie.

Źródło i obrazy

Rubin firmy NVIDIA integruje się z maszyną wirtualną Google, rozszerzając klastry wielostanowiskowe do prawie 1 miliona procesorów GPU

Przedstawiamy instancję A5X: dostosowaną do sztucznej inteligencji agentowej

Google Virgo i ConnectX-9: skalowanie infrastruktury AI

Osiąganie zwrotu z inwestycji: drastycznie obniżone koszty wnioskowania i zwiększona przepustowość

Powiązane artykuły:

Nowe funkcje DX12 w Microsoft Shader Model 6.10 i AgilitySDK 720 Preview dla renderowania neuronowego

Valve potwierdziło wyciek Steam Controllera: data premiery i wgląd w cenę; brak aktualizacji Steam Machine, ale pozytywne perspektywy od Valve

Dodaj komentarz Anuluj pisanie odpowiedzi