AMD Radeon AI PRO R9700 GPU는 Radeon PRO W7800에 비해 4배 향상된 TOPS와 2배 향상된 AI 성능을 제공합니다.

AMD Radeon AI PRO R9700 GPU는 Radeon PRO W7800에 비해 4배 향상된 TOPS와 2배 향상된 AI 성능을 제공합니다.

AMD는 새로운 Radeon AI PRO R9700 GPU에 대한 자세한 정보를 공개하면서, 기존 Radeon PRO W7800 모델과 비교했을 때 인공지능 작업에서의 역량을 강조했습니다.

AMD의 Radeon AI PRO R9700: AI 기능의 도약

AMD는 ROCm 7을 포함하여 소프트웨어 생태계를 업데이트하여 중요한 진전을 이루었습니다.이를 통해 자사의 AI 가속기 접근 방식을 세 가지 전략적 범주에 걸쳐 포지셔닝했습니다.여기에는 다음이 포함됩니다.

  • **Ryzen AI MAX APU:** 소규모에서 중규모, 대규모 언어 모델(LLM)을 대상으로 합니다.
  • **Radeon AI PRO GPU:** 다중 GPU 에지 추론과 중소 규모 LLM에 최적화되었습니다.
  • **Instinct AI 가속기:** 랙 규모 추론 및 학습에 중점을 둔 대규모 LLM을 위해 설계되었습니다.

MI350 시리즈에 대한 자세한 내용은 이미 공개되었지만, 주목을 끄는 것은 AMD의 Radeon AI PRO 시리즈입니다.이 시리즈의 R9700은 AI 성능이 크게 향상될 것으로 기대됩니다.

사양 및 성능 측정 항목

Radeon AI PRO R9700은 Navi 48 아키텍처를 기반으로 하며 64개의 컴퓨팅 유닛(4, 096개의 스트림 프로세서)을 탑재하고 있습니다.이 GPU의 특징은 다음과 같습니다.

  • **AI 가속기:** 향상된 계산을 위한 128개 유닛.
  • **열 설계 전력:** 최대 300W.
  • **메모리:** 256비트 버스를 통한 32GB GDDR6는 Radeon 9070 XT의 VRAM을 실질적으로 두 배로 늘립니다.

원시 연산 능력 측면에서 AMD는 다음과 같이 보고했습니다.

  • **FP16 컴퓨팅:** 96 TFLOP.
  • **INT4(희소):** 1531 TOPS.

R9700은 정교한 AI 모델의 효율적인 완성을 지원하여 고급 로컬 AI 워크로드에 매력적인 옵션입니다.이 GPU를 활용할 수 있는 주요 모델은 다음과 같습니다.

  • DeepSeek R1 Distill Qwen 32B Q6
  • 미스트랄 스몰 3.1 24B 인스트럭트 2503 Q8
  • 플럭스 1 패스트
  • SD 3.5 중간

경쟁 우위 및 비교

성능 평가 결과, DeepSeek R1 시나리오에서 R9700은 Radeon PRO W7800보다 두 배 빠른 속도로 작동합니다.또한, 16GB VRAM 버퍼를 탑재한 RTX 5080과 비교했을 때, R9700은 풍부한 메모리 용량 덕분에 최대 5배 더 빠른 성능을 발휘합니다.

인상적인 컴퓨팅 기능

Radeon AI PRO R9700의 자세한 컴퓨팅 지표는 강력한 AI 처리 능력을 보여줍니다.

  • **FP32:** 47.8 TFLOP.
  • **FP16/BF16:** 191.4 TFLOP.
  • **FP8:** 382.7 TFLOP.
  • **INT8:** 최고 382.7점.
  • **INT4:** 최대 765.5점.

WMMA(Wave Matrix Multiply Accumulate) 명령어와 구조화된 희소성과 같은 핵심 지원 기술은 성능 지표를 크게 향상시킵니다.

모델 지원 및 확장성

특히 AMD는 AI 작업에서 우수한 결과를 얻으려면 대용량 모델에 대한 지원이 필수적이라고 강조합니다.예를 들어, FP16에서 작동하는 8B로 분류된 텍스트-이미지 모델은 1B 모델에 비해 훨씬 우수한 결과를 얻을 수 있습니다.마찬가지로, 32B 6비트와 같은 대용량 모델을 사용하면 8B 6비트 설정보다 정확도를 높일 수 있습니다.

또한 R9700은 최신 PCIe 5.0 플랫폼에서 4-way 멀티 GPU 구성으로 통합되어 128GB의 놀라운 메모리 풀을 지원합니다.이 용량은 Mistral 123B 및 DeepSeek R1 70B와 같이 작동 중 112~116GB의 VRAM을 필요로 하는 고사양 모델에도 적합합니다.

출시 및 가용성

AMD Radeon AI PRO R9700은 7월에 출시될 예정이며, 다음을 포함한 신뢰할 수 있는 파트너를 통해 공급될 예정이므로 기대감이 높아지고 있습니다.

  • 아수스
  • 애즈락
  • 기가바이트
  • 파워컬러
  • 사파이어
  • 엑스에프엑스
  • 예스톤

이 GPU는 성능과 열 관리를 강화하기 위해 블로어 쿨러가 포함된 듀얼 슬롯 디자인을 특징으로 합니다.

라데온 R9700

Radeon Pro Workstation 그래픽과 비교

그래픽 카드 이름 라데온 R9700 라데온 프로 W7900 라데온 프로 W7800 라데온 프로 W6900X 라데온 프로 W6800 라데온 프로 VII 라데온 프로 W5700X 라데온 프로 W5700 라데온 프로 WX 9100 라데온 프로 WX 8200 라데온 프로 WX 7100
그래픽 카드 내비 48 내비 31 내비 31 내비 21 내비 21 베가 20 내비 10 내비 10 베가 10 베가 10 폴라리스 10
프로세스 노드 4nm 5nm+6nm 5nm+6nm 7nm 7nm 7nm 7nm 7nm 14nm 14nm 14nm
컴퓨팅 유닛 64CU 96CU 70CU 80 60 60 40 36 64 56 36
스트림 프로세서 4096 6144 4480 5120 3840 3840 2560 2304 4096 3584 2304
클럭 속도(피크) 미정 ~2.5GHz ~2.5GHz 2171MHz 2320MHz 1700MHz 2040MHz 1930MHz 1500MHz 1500MHz 1243MHz
비디오램 32GB GDDR6 48GB GDDR6 32GB GDDR6 32GB GDDR6 32GB GDDR6 16GB HBM2 16GB GDDR6 8GB GDDR6 16GB HBM2 8GB HBM2 8GB GDDR5
메모리 대역폭 640GB/초 864GB/초 576GB/초 512GB/초 512GB/초 1024GB/초 448GB/초 448GB/초 512GB/초 484GB/초 224GB/초
메모리 버스 256비트 384비트 256비트 256비트 256비트 4096비트 256비트 256비트 2048비트 2048비트 256비트
계산 속도(FP32) 48 TFLOP 61.3 TFLOPs 45.2 TFLOPs 22.23 TFLOPs 17.82 TFLOPs 13.1 TFLOPs 9.5 TFLOPs 8.89 TFLOPs 12.3 TFLOP 10.8 TFLOPs 5.7 TFLOP
열전력 300와트 295와트 260와트 300와트 250와트 250와트 240와트 205와트 250와트 230와트 150와트
가격 미정 3999달러 2499달러 5999달러 2249달러 1899달러 999달러 799달러 2199달러 999달러 799달러
시작하다 2025 2023 2023 2021 2021 2020 2019 2019 2017 2018 2016

출처 및 이미지

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다