M3 Ultra DeepSeek R1: 6,710億のパラメータ、448GBの統合メモリ、200W未満の高帯域幅パフォーマンス、マルチGPUは不要

M3 Ultra DeepSeek R1: 6,710億のパラメータ、448GBの統合メモリ、200W未満の高帯域幅パフォーマンス、マルチGPUは不要

今週初め、Apple は、最先端の M3 Ultra チップを搭載した Mac Studio の最新版を発表しました。この革新的なプロセッサは、パフォーマンス基準を再定義するだけでなく、最大 32 コアの CPU と 80 コアの GPU という優れた構成を特徴とし、Apple 自身のベンチマークを上回ります。この組み合わせにより、前身の M2 Ultra に比べて計算能力とグラフィック機能の両方が大幅に向上しています。さらに、M3 Ultra は、6, 710 億という驚異的なパラメータを誇る DeepSeek R1 モデルを難なく処理することで、その強さを実証しました。

パフォーマンスを革新する:M3 Ultra チップの機能

404GB の DeepSeek R1 モデルには、通常 GPU VRAM に関連付けられている高帯域幅メモリが必要です。Apple の M3 Ultra が他と一線を画しているのは、低消費電力を維持しながらリソースを効率的に割り当てている統合メモリ アーキテクチャです。YouTubeチャンネル Dave2Dの最近の分析では、このアーキテクチャがパフォーマンスを向上する仕組みについて、特に以前の Apple シリコン モデルと比較した際の洞察が提供されています。

対照的に、従来の PC セットアップでは、このような大規模な AI モデルを効率的に実行するために複数のハイエンド GPU が必要になることが多く、電力使用量が大幅に増加します。ただし、M3 Ultra チップははるかに高い効率で効果的に動作します。これは、高帯域幅メモリの共有リソース プールによるもので、複雑な AI モデルが VRAM に似た方法でメモリ リソースを利用できるため、最適なパフォーマンスが保証されます。

DeepSeek R1 モデルによる Apple M3 Ultra チップのパフォーマンス テスト

小さな AI モデルはリソースを使い果たすことなくスムーズかつ効率的に実行されますが、巨大な DeepSeek R1 には、驚異的な 512 GB のメモリを搭載した Apple のエリート M3 Ultra チップ構成が必要であることに注意することが重要です。ただし、macOS ではデフォルトの VRAM 割り当てが制限されるため、ターミナル経由で制限を 448 GB に増やして調整する必要があります。

DeepSeek R1 モデルは、精度を多少犠牲にした 4 ビットの量子化バージョンであるにもかかわらず、M3 Ultra Mac Studio の制約内で 6, 710 億のパラメータを維持しながら見事に機能します。消費電力の点では、M3 Ultra が際立っており、このリソース集約型モデルの実行中、システム全体の消費電力は 200W 未満です。このエネルギー要件は、従来のマルチ GPU システムが同様のパフォーマンス レベルを達成するために要求されるものに比べるとごくわずかです。Dave 氏は、このような構成では M3 Ultra チップの 10 倍の消費電力が必要になる可能性があると指摘しています。

M3 Ultraチップの性能分析

興味深いことに、6, 710 億という膨大なパラメータを持つ R1 モデルは、700 億パラメータのモデルのような小規模な反復と比較して優れたパフォーマンスを示しました。これは、M3 Ultra 設計に固有のアーキテクチャ効率によるものと考えられます。全体として、Apple の M3 Ultra チップは、従来の期待をはるかに超える広範な AI モデルを管理できる強力な候補として浮上しています。この注目すべきチップのパフォーマンスと効率について、さらに詳しい情報を提供していく予定ですので、今後のアップデートにご期待ください。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です