M3 Ultra DeepSeek R1: 671 Milliarden Parameter, 448 GB einheitlicher Speicher, hohe Bandbreitenleistung unter 200 W, kein Multi-GPU erforderlich

M3 Ultra DeepSeek R1: 671 Milliarden Parameter, 448 GB einheitlicher Speicher, hohe Bandbreitenleistung unter 200 W, kein Multi-GPU erforderlich

Anfang dieser Woche stellte Apple die neueste Version seines Mac Studio vor, die nun mit dem hochmodernen M3 Ultra Chip ausgestattet ist. Dieser innovative Prozessor setzt nicht nur neue Leistungsstandards, sondern übertrifft auch Apples eigene Benchmarks mit einer beeindruckenden Konfiguration aus bis zu 32 Kernen CPU und 80 Kernen GPU. Diese Kombination verbessert sowohl die Rechen- als auch die Grafikleistung im Vergleich zum Vorgänger, dem M2 Ultra, deutlich. Darüber hinaus hat der M3 Ultra seine Stärke durch die mühelose Verarbeitung des DeepSeek R1 Modells mit sage und schreibe 671 Milliarden Parametern unter Beweis gestellt.

Revolutionäre Leistung: Die Fähigkeiten des M3 Ultra Chips

Das 404 GB große DeepSeek R1-Modell benötigt einen Speicher mit hoher Bandbreite, der typischerweise mit GPU-VRAM verbunden ist. Was Apples M3 Ultra auszeichnet, ist seine einheitliche Speicherarchitektur, die Ressourcen effizient zuweist und gleichzeitig einen geringen Stromverbrauch gewährleistet. Eine aktuelle Analyse des YouTube-Kanals Dave2D zeigt, wie diese Architektur die Leistung steigert, insbesondere im Vergleich zu früheren Apple-Chipmodellen.

Im Gegensatz dazu benötigen herkömmliche PC-Systeme in der Regel mehrere High-End-GPUs, um solch umfangreiche KI-Modelle effizient auszuführen, was den Stromverbrauch deutlich erhöht. Der M3 Ultra-Chip arbeitet jedoch deutlich effizienter. Dies ist auf seinen gemeinsam genutzten Ressourcenpool mit bandbreitenstarkem Speicher zurückzuführen, der es komplexen KI-Modellen ermöglicht, Speicherressourcen ähnlich wie VRAM zu nutzen und so optimale Leistung zu gewährleisten.

Leistungstest des M3 Ultra Chips von Apple mit dem DeepSeek R1-Modell

Es ist wichtig zu beachten, dass kleinere KI-Modelle zwar reibungslos und effizient ausgeführt werden, ohne die Ressourcen vollständig auszuschöpfen, der riesige DeepSeek R1 jedoch Apples Elite-Chip M3 Ultra mit beachtlichen 512 GB Arbeitsspeicher benötigt.macOS schränkt jedoch die standardmäßige VRAM-Zuweisung ein, daher sind Anpassungen erforderlich – durch eine Erhöhung des Limits über das Terminal auf 448 GB.

Obwohl es sich um eine 4-Bit-quantisierte Version handelt, die etwas an Präzision einbüßt, funktioniert das DeepSeek R1-Modell innerhalb der Grenzen des M3 Ultra Mac Studio hervorragend und behält seine 671 Milliarden Parameter bei. In puncto Stromverbrauch sticht der M3 Ultra hervor: Das gesamte System verbraucht bei der Ausführung dieses ressourcenintensiven Modells weniger als 200 Watt. Dieser Energiebedarf ist nur ein Bruchteil dessen, was herkömmliche Multi-GPU-Systeme benötigen würden, um ähnliche Leistungsniveaus zu erreichen. Dave weist darauf hin, dass solche Konfigurationen möglicherweise den zehnfachen Stromverbrauch des M3 Ultra-Chips erfordern könnten.

M3 Ultra Chip-Leistungsanalyse

Interessanterweise zeigte das R1-Modell mit seinen enormen 671 Milliarden Parametern eine überlegene Leistung im Vergleich zu kleineren Iterationen wie dem 70-Milliarden-Parameter-Modell, möglicherweise aufgrund der architektonischen Effizienz des M3 Ultra-Designs. Insgesamt erweist sich Apples M3 Ultra-Chip als leistungsstarker Kandidat, der umfangreiche KI-Modelle weit über herkömmliche Erwartungen hinaus verwalten kann. Wir freuen uns darauf, weitere Einblicke in die Leistung und Effizienz dieses bemerkenswerten Chips zu geben. Bleiben Sie also gespannt auf weitere Updates.

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert