AMD kooperiert mit GlobalFoundries bei der Entwicklung von MI500-Co-Packaged-Optiken inmitten des zunehmenden Wettbewerbs mit NVIDIA im Bereich der Siliziumphotonik.

AMD kooperiert mit GlobalFoundries bei der Entwicklung von MI500-Co-Packaged-Optiken inmitten des zunehmenden Wettbewerbs mit NVIDIA im Bereich der Siliziumphotonik.

Advanced Micro Devices (AMD) wird mit GlobalFoundries zusammenarbeiten, um seine Co-Packaged Optics (CPO)-Lösung weiterzuentwickeln, eine entscheidende Komponente für die kommenden KI-Beschleuniger Instinct MI500.

Zusammenarbeit zwischen GlobalFoundries und AMD bei der Entwicklung von Co-Packaged-Optiken der nächsten Generation

Die Co-Packaged Optics (CPO)-Technologie, auch bekannt als Siliziumphotonik, stellt einen Quantensprung in der Reduzierung der Abhängigkeit von Kupferleitungen dar, indem sie Licht zur Signalübertragung nutzt. Diese Innovation ermöglicht die direkte Integration von CPOs in Hardwarebeschleuniger wie GPUs, wodurch die Latenzzeiten der Verbindungen deutlich verbessert und eine Kommunikation mit hoher Bandbreite zwischen CPUs und GPUs ermöglicht wird – eine Voraussetzung für zukünftige KI-Rechenzentren.

Sowohl AMD als auch NVIDIA rüsten sich, um CPO-Technologien für ihre KI-Grafikprozessoren (GPUs) der nächsten Generation zu nutzen. AMDs Initiative umfasst eine einzigartige, MRM-basierte CPO-Lösung, die speziell für die Instinct MI500-Beschleuniger entwickelt wurde. Die Fertigung der photonischen integrierten Schaltungen (PICs) für dieses Projekt übernimmt GlobalFoundries, das Packaging wird von ASE bereitgestellt. Im vergangenen Jahr stärkte AMD seine Kompetenzen durch die Übernahme des Photonik-Spezialisten Enosemi, um die Weiterentwicklung von CPO-Technologien zu beschleunigen.

Ähnlich entwickelt NVIDIA Berichten zufolge eigene CPO-PICs für die kommenden Vera-Rubin-Beschleuniger. Die Fertigung dieser Schaltungen übernimmt TSMC, SPIL ist für das Packaging zuständig, und die Endmontage erfolgt bei Foxconn Industrial Internet, einem Tochterunternehmen von Foxconn. Beim Rubin-Ultra-Modell hat die CPO-Implementierung Vorrang vor Near-Package Optics (NPO).

Mit fortschreitender Entwicklung plant NVIDIA, Co-Packaged Optics vollständig in seine Feynman-Generation von KI-Beschleunigern zu integrieren und damit die Abhängigkeit von NPOs zu beseitigen.

Die Fortschritte von AMD bei der MI500-Serie sind bemerkenswert, da sie einen hochmodernen 2-nm-Fertigungsprozess nutzt und damit die kommende MI400-Serie übertrifft, die zwar ebenfalls auf 2-nm-Technologie basiert, aber nicht so fortschrittlich sein wird wie die MI500. Die MI500-Beschleuniger profitieren von der zukunftsweisenden CDNA-6-Architektur, während die MI400 die CDNA-5-Architektur verwendet. Darüber hinaus kommt bei der MI500 HBM4E-Speicher zum Einsatz, der im Vergleich zum Vorgänger, den MI400-Beschleunigern mit HBM4-Speicher, eine außergewöhnlich hohe Speicherbandbreite von über 19, 6 TB/s verspricht.

Entgegen früheren Spekulationen hat AMD bestätigt, dass es seine Architektur-Namenskonvention für Instinct-GPUs beibehalten und nicht auf die Marke UDNA umsteigen wird.

Eine Roadmap-Grafik mit dem Titel „Erweiterung der Leadership Roadmap“, die die AMD Instinct GPUs MI300A/X für 2023, MI325X für 2024, MI350-Serie für 2025, MI400-Serie für 2026 und MI500-Serie für 2027 zeigt.

AMD macht mit der Einführung der Instinct MI500-Serie ambitionierte Versprechen hinsichtlich der KI-Leistung und strebt innerhalb von vier Jahren eine mehr als tausendfache Steigerung der KI-Fähigkeiten an. Dieses ehrgeizige Ziel ist entscheidend, um den rasant steigenden KI-Bedarf zu decken und die Wettbewerbsfähigkeit zu erhalten, insbesondere angesichts der zunehmenden technologischen Anstrengungen der Konkurrenz. Die Markteinführung der MI500-Serie wird für 2027 erwartet.

Überblick über die AMD Instinct KI-Beschleuniger

Beschleunigername AMD Instinct MI500 AMD Instinct MI400 AMD Instinct MI350X AMD Instinct MI325X AMD Instinct MI300X AMD Instinct MI250X
GPU-Architektur cDNA 6 cDNA 5 cDNA 4 Aqua Vanjaram (CDNA 3) Aqua Vanjaram (CDNA 3) Aldebaran (CDNA 2)
GPU-Prozessknoten 2 nm 2 nm + 3 nm 3 nm 5 nm + 6 nm 5 nm + 6 nm 6 nm
XCDs (Chiplets) TBD 8 (MCM) 8 (MCM) 8 (MCM) 8 (MCM) 2 (MCM) 1 (pro Die)
GPU-Kerne TBD TBD 16.384 19.456 19.456 14.080
GPU-Taktfrequenz (Max.) TBD TBD 2400 MHz 2100 MHz 2100 MHz 1700 MHz
INT8 Berechnen TBD TBD 5200 TOPS 2614 TOPS 2614 TOPS 383 TOPS
FP6/FP4-Matrix TBD 40 PFLOPs 20 PFLOPs N / A N / A N / A
FP8-Matrix TBD 20 PFLOPs 5 PFLOPs 2, 6 PFLOPs 2, 6 PFLOPs N / A
FP16-Matrix TBD 10 PFLOPs 2, 5 PFLOPs 1, 3 PFLOPs 1, 3 PFLOPs 383 TFLOPS
FP32-Vektor TBD TBD 157, 3 TFLOPS 163, 4 TFLOPS 163, 4 TFLOPS 95, 7 TFLOPS
FP64-Vektor TBD TBD 78, 6 TFLOPS 81, 7 TFLOPS 81, 7 TFLOPS 47, 9 TFLOPS
VRAM HBM4E 432 GB HBM4 288 GB HBM3e 256 GB HBM3e 192 GB HBM3 128 GB HBM2e
Infinity Cache TBD TBD 256 MB 256 MB 256 MB N / A
Speicheruhr TBD 19, 6 TB/s 8, 0 Gbit/s 5, 9 Gbit/s 5, 2 Gbit/s 3, 2 Gbit/s
Speicherbus TBD TBD 8192-Bit 8192-Bit 8192-Bit 8192-Bit
Speicherbandbreite TBD TBD 8 TB/s 6, 0 TB/s 5, 3 TB/s 3, 2 TB/s
Formfaktor TBD TBD OAM OAM OAM OAM
Kühlung TBD Passiv / Flüssig Passiv / Flüssig Passive Kühlung Passive Kühlung Passive Kühlung
TDP (Max) TBD TBD 1400W (355X) 1000 W 750 W 560 W

Für weitere Einblicke können Sie die neuesten Updates von @jukan05 einsehen.

Für Bilder und weitere Details besuchen Sie Wccftech.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert