W ramach niezwykłej współpracy Google i NVIDIA łączą siły, aby zaoferować użytkownikom dostęp do nawet miliona procesorów graficznych NVIDIA. Inicjatywa ta jest częścią wprowadzenia na rynek nowych instancji A5X, których celem jest obniżenie kosztów wnioskowania i zwiększenie przepustowości tokenów. System A5X integruje zaawansowane akceleratory sieciowe firmy NVIDIA, tworząc podwaliny pod solidne, jedno- i wieloklastrowe infrastruktury obliczeniowe, zaprojektowane specjalnie dla obciążeń AI.
Przedstawiamy instancję A5X: dostosowaną do sztucznej inteligencji agentowej
Instancja A5X to najnowsze osiągnięcie Google, stworzone specjalnie z myślą o obciążeniach związanych ze sztuczną inteligencją opartą na agentach. Należy ona do rozwijającego się portfolio AI Hypercomputer, które stanowi podstawę platformy Google Gemini, obsługującej różnorodne aplikacje AI dla użytkowników indywidualnych i przedsiębiorstw. Ta nowa oferta wprowadza znaczące ulepszenia do Hypercomputer, oferując specjalnie zaprojektowane maszyny wirtualne oparte na niestandardowych procesorach ARM, procesorach Tensor ósmej generacji, natywną obsługę PyTorch TPU oraz, oczywiście, innowacyjne instancje A5X.
Zaprojektowane do obsługi scenariuszy AI opartych na agentach, instancje A5X wykorzystują kolektyw agentów AI, wdrażając metodologię fragmentaryczną w celu rozwiązywania złożonych problemów. Co istotne, te instancje są pierwszymi instancjami Google, które są kompatybilne z najnowocześniejszymi procesorami graficznymi Vera Rubin AI firmy NVIDIA.

Google Virgo i ConnectX-9: skalowanie infrastruktury AI
Instancje A5X wykorzystają możliwości kart sieciowych (NIC) ConnectX-9 firmy NVIDIA, które zostały zaprojektowane z myślą o zwiększeniu obciążeń AI w środowiskach chmurowych wykorzystujących Ethernet. Ta synergia technologiczna, w połączeniu z platformą Virgo firmy Google, umożliwia użytkownikom wdrożenie do 80 000 procesorów graficznych Rubin w jednym klastrze oraz aż 960 000 procesorów graficznych w klastrach wielolokalizacyjnych.
| Część | Maksymalny pojedynczy klaster centrów danych | Maksymalny klaster wielostanowiskowy |
| Procesory graficzne NVIDIA Vera Rubin | 80 000 | 960 000 |
| Niestandardowe procesory TPU firmy Google | 134 000 | 1 000 000+ |
| Szkielet sieciowy | Karty sieciowe NVIDIA ConnectX-9 | Platforma Google Virgo |
Osiąganie zwrotu z inwestycji: drastycznie obniżone koszty wnioskowania i zwiększona przepustowość
Platforma Google Virgo zapewnia bezprecedensową łączność między licznymi układami AI w jednym centrum danych. Ta solidna infrastruktura nie tylko współpracuje z procesorami graficznymi Vera Rubin firmy NVIDIA, ale także bezproblemowo integruje się z procesorami tensorowymi (TPU) firmy Google. Virgo może połączyć do 134 000 układów TPU w jednym centrum danych i ponad milion układów w wielu lokalizacjach. Co godne uwagi, NVIDIA twierdzi, że instancje A5X mogą zapewnić dziesięciokrotną redukcję kosztów wnioskowania na token, jednocześnie zwiększając przepustowość dziesięciokrotnie na megawat w porównaniu z wcześniejszymi modelami.
Ponadto NVIDIA podkreśla współpracę z liderami branży, takimi jak Cadence i Siemens, prezentując, jak ich produkty są zasilane przez tę infrastrukturę i dostępne za pośrednictwem Google Cloud. Co więcej, platforma Gemini firmy Google jest gotowa do wdrażania modeli agentowych i przepływów pracy w wielu sektorach, w tym w cyberbezpieczeństwie.
Dodaj komentarz