NVIDIAs Rubin integriert sich in Googles Virtual Machine und erweitert Multi-Site-Cluster auf fast 1 Million GPUs.

NVIDIAs Rubin integriert sich in Googles Virtual Machine und erweitert Multi-Site-Cluster auf fast 1 Million GPUs.

In einer bemerkenswerten Kooperation bündeln Google und NVIDIA ihre Kräfte, um Nutzern Zugriff auf bis zu eine Million NVIDIA-GPUs zu ermöglichen. Diese Initiative ist Teil der Einführung der neuen A5X-Instanzen, die darauf abzielen, die Inferenzkosten zu senken und den Token-Durchsatz zu erhöhen. Das A5X-System integriert NVIDIAs fortschrittliche Netzwerkbeschleuniger und schafft damit die Grundlage für robuste Einzel- und Multi-Cluster-Computing-Infrastrukturen, die speziell für KI-Workloads entwickelt wurden.

Wir stellen die A5X-Instanz vor: Maßgeschneidert für Agentic AI

Die A5X-Instanz ist Googles neueste Entwicklung, speziell für agentenbasierte KI-Workloads konzipiert. Sie gehört zum wachsenden Portfolio von AI Hypercomputer, das die Gemini-Plattform von Google unterstützt und diverse KI-Anwendungen für Privat- und Geschäftskunden ermöglicht. Dieses neue Angebot geht einher mit bedeutenden Upgrades von Hypercomputer, darunter speziell entwickelte virtuelle Maschinen mit angepassten Arm-basierten CPUs, Tensor-Prozessoren der achten Generation, nativer PyTorch-TPU-Unterstützung und natürlich den innovativen A5X-Instanzen.

Die A5X-Instanzen wurden für die Bewältigung agentenbasierter KI-Szenarien entwickelt und nutzen eine Vielzahl von KI-Agenten, um komplexe Probleme mithilfe einer schrittweisen Methodik zu lösen. Bemerkenswert ist, dass diese Instanzen die ersten von Google sind, die mit NVIDIAs hochmodernen Vera Rubin KI-GPUs kompatibel sind.

Eine Präsentationsfolie mit der Rubin GPU und der Groq 3 LPU inklusive Spezifikationen sowie einer Person auf der Bühne unter der Überschrift „Vereint Prozessoren extremer Leistung“.

Google Virgo & ConnectX-9: Skalierung der KI-Infrastruktur

Die A5X-Instanzen nutzen die Leistungsfähigkeit der NVIDIA ConnectX-9 Netzwerkkarten (NICs), die speziell für die Optimierung von KI-Workloads in Cloud-Umgebungen mit Ethernet entwickelt wurden. Diese technologische Synergie ermöglicht es Nutzern in Kombination mit Googles Virgo-Plattform, bis zu 80.000 Rubin-GPUs in einem einzelnen Cluster und beeindruckende 960.000 GPUs in Clustern mit mehreren Standorten bereitzustellen.

Komponente Maximaler Cluster in einem einzelnen Rechenzentrum Max Multi-Site Cluster
NVIDIA Vera Rubin GPUs 80.000 960.000
Google Custom TPUs 134.000 Mehr als 1.000.000
Netzwerk-Backbone NVIDIA ConnectX-9 Netzwerkkarten Google Virgo Plattform

Erzielung eines hohen ROI: Dramatisch reduzierte Inferenzkosten und erhöhter Durchsatz

Die Google Virgo-Plattform ermöglicht eine beispiellose Vernetzung zahlreicher KI-Chips innerhalb eines einzigen Rechenzentrums. Diese robuste Infrastruktur arbeitet nicht nur mit NVIDIAs Vera Rubin GPUs zusammen, sondern integriert sich auch nahtlos in Googles Tensor Processing Units (TPUs).Virgo kann bis zu 134.000 TPUs in einem Rechenzentrum und über eine Million Chips an verschiedenen Standorten verbinden. NVIDIA gibt an, dass A5X-Instanzen die Inferenzkosten pro Token um das Zehnfache senken und gleichzeitig den Durchsatz pro Megawatt im Vergleich zu Vorgängermodellen verzehnfachen können.

NVIDIA hebt zudem die Zusammenarbeit mit Branchenführern wie Cadence und Siemens hervor und zeigt, wie deren Produkte auf dieser Infrastruktur basieren und über Google Cloud zugänglich sind. Darüber hinaus ist Googles Gemini-Plattform bereit, agentenbasierte Modelle und Workflows in verschiedenen Branchen, darunter auch der Cybersicherheit, einzusetzen.

Quellen & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert