
AMD hat detaillierte Einblicke in seine neue Radeon AI PRO R9700 GPU gegeben und deren Fähigkeiten bei Aufgaben der künstlichen Intelligenz im Vergleich zum bestehenden Modell Radeon PRO W7800 hervorgehoben.
AMDs Radeon AI PRO R9700: Ein Sprung in der KI-Fähigkeit
AMD hat sein Software-Ökosystem um ROCm 7 erweitert und seinen KI-Beschleunigungsansatz in drei strategischen Kategorien positioniert. Dazu gehören:
- **Ryzen AI MAX APUs:** Ausgerichtet auf kleine bis mittelgroße Sprachmodelle (LLMs).
- **Radeon AI PRO GPUs:** Optimiert für Multi-GPU-Edge-Inferenz und kleine bis mittlere LLMs.
- **Instinct AI Accelerators:** Entwickelt für große LLMs mit Schwerpunkt auf Rack-Scale-Inferenz und Training.
Während die MI350-Serie detailliert beschrieben wurde, liegt das Rampenlicht auf der Radeon AI PRO-Serie von AMD, bei der die R9700 erhebliche Fortschritte bei der KI-Leistung verspricht.
Spezifikationen und Leistungskennzahlen
Die Radeon AI PRO R9700 basiert auf der Navi 48-Architektur und ist mit 64 Recheneinheiten ausgestattet, was 4096 Stream-Prozessoren entspricht. Diese GPU bietet:
- **KI-Beschleuniger:** 128 Einheiten für verbesserte Berechnungen.
- **Thermal Design Power:** Maximal 300 W.
- **Speicher:** 32 GB GDDR6 über einen 256-Bit-Bus, wodurch der VRAM der Radeon 9070 XT effektiv verdoppelt wird.
In Bezug auf die reine Rechenleistung hat AMD Folgendes gemeldet:
- **FP16-Berechnung:** 96 TFLOPs.
- **INT4 (spärlich):** 1531 TOPS.
Der R9700 soll die effiziente Bearbeitung anspruchsvoller KI-Modelle ermöglichen und ist damit eine attraktive Option für anspruchsvolle lokale KI-Workloads. Zu den bemerkenswerten Modellen, die diese GPU nutzen können, gehören:
- DeepSeek R1 Distill Qwen 32B Q6
- Mistral Small 3.1 24B Instruct 2503 Q8
- Flux 1 Schnel
- SD 3.5 Mittel
Wettbewerbsvorteile und Vergleiche
Leistungsbewertungen zeigen, dass die R9700 im DeepSeek R1-Szenario doppelt so schnell arbeitet wie die Radeon PRO W7800. Vergleiche mit der RTX 5080, die über einen 16 GB großen VRAM-Puffer verfügt, zeigen zudem, dass die R9700 dank ihrer umfangreichen Speicherkapazitäten bis zu fünfmal schneller arbeitet.
Beeindruckende Rechenleistung
Detaillierte Rechenmetriken für die Radeon AI PRO R9700 veranschaulichen ihre beeindruckende KI-Verarbeitungsleistung:
- **FP32:** 47, 8 TFLOPs.
- **FP16/BF16:** 191, 4 TFLOPs.
- **FP8:** 382, 7 TFLOPs.
- **INT8:** 382, 7 HÖCHSTENS.
- **INT4:** HÖCHSTENS 765, 5.
Wichtige unterstützende Technologien wie Wave Matrix Multiply Accumulate (WMMA)-Anweisungen und strukturierte Sparsity steigern die Leistungskennzahlen erheblich.
Modellunterstützung und Skalierbarkeit
AMD betont insbesondere, dass die Unterstützung größerer Modelle für bessere Ergebnisse bei KI-Aufgaben entscheidend ist. Beispielsweise kann ein als 8B klassifiziertes Text-zu-Bild-Modell, das auf FP16 läuft, im Vergleich zu einem 1B-Modell deutlich bessere Ergebnisse liefern. Ebenso kann die Verwendung von Modellen mit höherer Kapazität, wie beispielsweise einem 32B-6-Bit-Setup, die Genauigkeit gegenüber einem 8B-6-Bit-Setup verbessern.
Darüber hinaus kann der R9700 in eine 4-Wege-Multi-GPU-Konfiguration auf einer modernen PCIe 5.0-Plattform integriert werden, wodurch ein beachtlicher Speicherpool von 128 GB entsteht. Diese Kapazität reicht für anspruchsvolle Modelle wie Mistral 123B und DeepSeek R1 70B, die im Betrieb 112–116 GB VRAM benötigen.
Veröffentlichung und Verfügbarkeit
Die Vorfreude steigt, da die AMD Radeon AI PRO R9700 voraussichtlich im Juli auf den Markt kommt und über vertrauenswürdige Partner erhältlich sein wird, darunter:
- ASUS
- ASRock
- Gigabyte
- PowerColor
- Saphir
- XFX
- Yeston
Diese GPU verfügt über ein Dual-Slot-Design mit Gebläsekühler, um die Leistung und das Wärmemanagement zu verbessern.

Vergleich mit Radeon Pro Workstation Graphics
Name der Grafikkarte | Radeon R9700 | Radeon Pro W7900 | Radeon Pro W7800 | Radeon Pro W6900X | Radeon Pro W6800 | Radeon Pro VII | Radeon Pro W5700X | Radeon Pro W5700 | Radeon Pro WX 9100 | Radeon Pro WX 8200 | Radeon Pro WX 7100 |
---|---|---|---|---|---|---|---|---|---|---|---|
Grafikkarte | Navi 48 | Navi 31 | Navi 31 | Navi 21 | Navi 21 | Vega 20 | Navi 10 | Navi 10 | Vega 10 | Vega 10 | Polaris 10 |
Prozessknoten | 4 nm | 5 nm + 6 nm | 5 nm + 6 nm | 7 nm | 7 nm | 7 nm | 7 nm | 7 nm | 14 nm | 14 nm | 14 nm |
Recheneinheiten | 64 Einheiten | 96 Einheiten | 70 Einheiten | 80 | 60 | 60 | 40 | 36 | 64 | 56 | 36 |
Stream-Prozessoren | 4096 | 6144 | 4480 | 5120 | 3840 | 3840 | 2560 | 2304 | 4096 | 3584 | 2304 |
Taktfrequenz (Spitze) | Wird noch bekannt gegeben | ~2, 5 GHz | ~2, 5 GHz | 2171 MHz | 2320 MHz | 1700 MHz | 2040 MHz | 1930 MHz | 1500 MHz | 1500 MHz | 1243 MHz |
VRAM | 32 GB GDDR6 | 48 GB GDDR6 | 32 GB GDDR6 | 32 GB GDDR6 | 32 GB GDDR6 | 16 GB HBM2 | 16 GB GDDR6 | 8 GB GDDR6 | 16 GB HBM2 | 8 GB HBM2 | 8 GB GDDR5 |
Speicherbandbreite | 640 GB/s | 864 GB/s | 576 GB/s | 512 GB/s | 512 GB/s | 1024 GB/s | 448 GB/s | 448 GB/s | 512 GB/s | 484 GB/s | 224 GB/s |
Speicherbus | 256 Bit | 384 Bit | 256 Bit | 256 Bit | 256 Bit | 4096 Bit | 256 Bit | 256 Bit | 2048 Bit | 2048 Bit | 256 Bit |
Rechenrate (FP32) | 48 TFLOPs | 61, 3 TFLOPs | 45, 2 TFLOPs | 22, 23 TFLOPs | 17, 82 TFLOPs | 13.1 TFLOPs | 9, 5 TFLOPs | 8, 89 TFLOPs | 12.3 TFLOPs | 10, 8 TFLOPs | 5, 7 TFLOPs |
TDP | 300 W | 295 W | 260 W | 300 W | 250 W | 250 W | 240 W | 205 W | 250 W | 230 W | 150 W |
Preis | Wird noch bekannt gegeben | 3999 US-Dollar | 2499 US-Dollar | 5999 US-Dollar | 2249 US-Dollar | 1899 US-Dollar | 999 US-Dollar | 799 US-Dollar | 2199 US-Dollar | 999 US-Dollar | 799 US-Dollar |
Start | 2025 | 2023 | 2023 | 2021 | 2021 | 2020 | 2019 | 2019 | 2017 | 2018 | 2016 |
Schreibe einen Kommentar