M3 Ultra DeepSeek R1: 6710억 개의 매개변수, 448GB 통합 메모리, 200W 미만의 고대역폭 성능, 다중 GPU 필요 없음

M3 Ultra DeepSeek R1: 6710억 개의 매개변수, 448GB 통합 메모리, 200W 미만의 고대역폭 성능, 다중 GPU 필요 없음

이번 주 초에 Apple은 최신 Mac Studio 버전을 공개했는데, 이제 최첨단 M3 Ultra 칩으로 구동됩니다.이 혁신적인 프로세서는 성능 표준을 재정의할 뿐만 아니라 최대 32코어 CPU와 80코어 GPU의 인상적인 구성을 특징으로 하는 Apple의 벤치마크를 능가합니다.이 조합은 이전 모델인 M2 Ultra보다 계산 및 그래픽 기능을 크게 향상시킵니다.또한 M3 Ultra는 무려 6, 710억 개의 매개변수를 자랑하는 DeepSeek R1 모델을 손쉽게 처리하여 강점을 입증했습니다.

성능 혁신: M3 Ultra 칩의 기능

404GB의 DeepSeek R1 모델은 일반적으로 GPU VRAM과 관련된 고대역폭 메모리를 필요로 합니다. Apple의 M3 Ultra를 차별화하는 것은 낮은 전력 소비를 유지하면서도 리소스를 효율적으로 할당하는 통합 메모리 아키텍처입니다.YouTube 채널 Dave2D 의 최근 분석은 이 아키텍처가 어떻게 성능을 높이는지에 대한 통찰력을 제공하며, 특히 이전 Apple 실리콘 모델과 비교할 때 그렇습니다.

반면, 기존 PC 설정은 일반적으로 이러한 광범위한 AI 모델을 효율적으로 실행하기 위해 여러 개의 하이엔드 GPU가 필요하여 전력 사용량이 크게 증가합니다.그러나 M3 Ultra 칩은 훨씬 더 높은 효율성으로 효과적으로 작동합니다.이는 고대역폭 메모리의 공유 리소스 풀에 기인하며, 이를 통해 복잡한 AI 모델이 VRAM과 유사한 방식으로 메모리 리소스를 활용하여 최적의 성능을 보장할 수 있습니다.

DeepSeek R1 모델을 사용한 Apple의 M3 Ultra 칩 성능 테스트

작은 AI 모델은 모든 리소스를 고갈시키지 않고도 원활하고 효율적으로 실행되는 반면, 거대한 DeepSeek R1은 놀라운 512GB 메모리를 갖춘 Apple의 엘리트 M3 Ultra 칩 구성이 필요하다는 점에 유의하는 것이 중요합니다.그러나 macOS는 기본 VRAM 할당을 제한하므로 조정이 필요합니다.터미널을 통해 제한을 448GB로 늘려서 수행합니다.

일부 정밀도를 희생한 4비트 양자화 버전임에도 불구하고 DeepSeek R1 모델은 M3 Ultra Mac Studio의 제약 내에서 6, 710억 개의 매개변수를 유지하면서도 훌륭하게 작동합니다.전력 소비 측면에서 M3 Ultra는 두드러지며, 이 리소스 집약적 모델을 실행하는 동안 전체 시스템이 200W 미만을 소모합니다.이러한 에너지 요구 사항은 기존의 다중 GPU 시스템이 유사한 성능 수준을 달성하는 데 필요한 것의 일부에 불과하며, Dave는 이러한 구성이 잠재적으로 M3 Ultra 칩의 10배의 전력 소비를 필요로 할 수 있다고 언급했습니다.

M3 Ultra 칩 성능 분석

흥미롭게도, 방대한 6, 710억 개의 매개변수를 가진 R1 모델은 700억 개의 매개변수 모델과 같은 더 작은 반복 모델에 비해 더 우수한 성능을 보였습니다.아마도 M3 Ultra 디자인의 고유한 구조적 효율성 때문일 것입니다.전반적으로 Apple의 M3 Ultra 칩은 기존의 기대치를 훨씬 뛰어넘는 광범위한 AI 모델을 관리할 수 있는 강력한 경쟁자로 떠올랐습니다.이 놀라운 칩의 성능과 효율성에 대한 추가 통찰력을 제공할 것으로 예상되므로 추가 업데이트를 기대하세요.

출처 및 이미지

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다