
AMD는 새로운 Radeon AI PRO R9700 GPU에 대한 자세한 정보를 공개하면서, 기존 Radeon PRO W7800 모델과 비교했을 때 인공지능 작업에서의 역량을 강조했습니다.
AMD의 Radeon AI PRO R9700: AI 기능의 도약
AMD는 ROCm 7을 포함하여 소프트웨어 생태계를 업데이트하여 중요한 진전을 이루었습니다.이를 통해 자사의 AI 가속기 접근 방식을 세 가지 전략적 범주에 걸쳐 포지셔닝했습니다.여기에는 다음이 포함됩니다.
- **Ryzen AI MAX APU:** 소규모에서 중규모, 대규모 언어 모델(LLM)을 대상으로 합니다.
- **Radeon AI PRO GPU:** 다중 GPU 에지 추론과 중소 규모 LLM에 최적화되었습니다.
- **Instinct AI 가속기:** 랙 규모 추론 및 학습에 중점을 둔 대규모 LLM을 위해 설계되었습니다.
MI350 시리즈에 대한 자세한 내용은 이미 공개되었지만, 주목을 끄는 것은 AMD의 Radeon AI PRO 시리즈입니다.이 시리즈의 R9700은 AI 성능이 크게 향상될 것으로 기대됩니다.
사양 및 성능 측정 항목
Radeon AI PRO R9700은 Navi 48 아키텍처를 기반으로 하며 64개의 컴퓨팅 유닛(4, 096개의 스트림 프로세서)을 탑재하고 있습니다.이 GPU의 특징은 다음과 같습니다.
- **AI 가속기:** 향상된 계산을 위한 128개 유닛.
- **열 설계 전력:** 최대 300W.
- **메모리:** 256비트 버스를 통한 32GB GDDR6는 Radeon 9070 XT의 VRAM을 실질적으로 두 배로 늘립니다.
원시 연산 능력 측면에서 AMD는 다음과 같이 보고했습니다.
- **FP16 컴퓨팅:** 96 TFLOP.
- **INT4(희소):** 1531 TOPS.
R9700은 정교한 AI 모델의 효율적인 완성을 지원하여 고급 로컬 AI 워크로드에 매력적인 옵션입니다.이 GPU를 활용할 수 있는 주요 모델은 다음과 같습니다.
- DeepSeek R1 Distill Qwen 32B Q6
- 미스트랄 스몰 3.1 24B 인스트럭트 2503 Q8
- 플럭스 1 패스트
- SD 3.5 중간
경쟁 우위 및 비교
성능 평가 결과, DeepSeek R1 시나리오에서 R9700은 Radeon PRO W7800보다 두 배 빠른 속도로 작동합니다.또한, 16GB VRAM 버퍼를 탑재한 RTX 5080과 비교했을 때, R9700은 풍부한 메모리 용량 덕분에 최대 5배 더 빠른 성능을 발휘합니다.
인상적인 컴퓨팅 기능
Radeon AI PRO R9700의 자세한 컴퓨팅 지표는 강력한 AI 처리 능력을 보여줍니다.
- **FP32:** 47.8 TFLOP.
- **FP16/BF16:** 191.4 TFLOP.
- **FP8:** 382.7 TFLOP.
- **INT8:** 최고 382.7점.
- **INT4:** 최대 765.5점.
WMMA(Wave Matrix Multiply Accumulate) 명령어와 구조화된 희소성과 같은 핵심 지원 기술은 성능 지표를 크게 향상시킵니다.
모델 지원 및 확장성
특히 AMD는 AI 작업에서 우수한 결과를 얻으려면 대용량 모델에 대한 지원이 필수적이라고 강조합니다.예를 들어, FP16에서 작동하는 8B로 분류된 텍스트-이미지 모델은 1B 모델에 비해 훨씬 우수한 결과를 얻을 수 있습니다.마찬가지로, 32B 6비트와 같은 대용량 모델을 사용하면 8B 6비트 설정보다 정확도를 높일 수 있습니다.
또한 R9700은 최신 PCIe 5.0 플랫폼에서 4-way 멀티 GPU 구성으로 통합되어 128GB의 놀라운 메모리 풀을 지원합니다.이 용량은 Mistral 123B 및 DeepSeek R1 70B와 같이 작동 중 112~116GB의 VRAM을 필요로 하는 고사양 모델에도 적합합니다.
출시 및 가용성
AMD Radeon AI PRO R9700은 7월에 출시될 예정이며, 다음을 포함한 신뢰할 수 있는 파트너를 통해 공급될 예정이므로 기대감이 높아지고 있습니다.
- 아수스
- 애즈락
- 기가바이트
- 파워컬러
- 사파이어
- 엑스에프엑스
- 예스톤
이 GPU는 성능과 열 관리를 강화하기 위해 블로어 쿨러가 포함된 듀얼 슬롯 디자인을 특징으로 합니다.

Radeon Pro Workstation 그래픽과 비교
그래픽 카드 이름 | 라데온 R9700 | 라데온 프로 W7900 | 라데온 프로 W7800 | 라데온 프로 W6900X | 라데온 프로 W6800 | 라데온 프로 VII | 라데온 프로 W5700X | 라데온 프로 W5700 | 라데온 프로 WX 9100 | 라데온 프로 WX 8200 | 라데온 프로 WX 7100 |
---|---|---|---|---|---|---|---|---|---|---|---|
그래픽 카드 | 내비 48 | 내비 31 | 내비 31 | 내비 21 | 내비 21 | 베가 20 | 내비 10 | 내비 10 | 베가 10 | 베가 10 | 폴라리스 10 |
프로세스 노드 | 4nm | 5nm+6nm | 5nm+6nm | 7nm | 7nm | 7nm | 7nm | 7nm | 14nm | 14nm | 14nm |
컴퓨팅 유닛 | 64CU | 96CU | 70CU | 80 | 60 | 60 | 40 | 36 | 64 | 56 | 36 |
스트림 프로세서 | 4096 | 6144 | 4480 | 5120 | 3840 | 3840 | 2560 | 2304 | 4096 | 3584 | 2304 |
클럭 속도(피크) | 미정 | ~2.5GHz | ~2.5GHz | 2171MHz | 2320MHz | 1700MHz | 2040MHz | 1930MHz | 1500MHz | 1500MHz | 1243MHz |
비디오램 | 32GB GDDR6 | 48GB GDDR6 | 32GB GDDR6 | 32GB GDDR6 | 32GB GDDR6 | 16GB HBM2 | 16GB GDDR6 | 8GB GDDR6 | 16GB HBM2 | 8GB HBM2 | 8GB GDDR5 |
메모리 대역폭 | 640GB/초 | 864GB/초 | 576GB/초 | 512GB/초 | 512GB/초 | 1024GB/초 | 448GB/초 | 448GB/초 | 512GB/초 | 484GB/초 | 224GB/초 |
메모리 버스 | 256비트 | 384비트 | 256비트 | 256비트 | 256비트 | 4096비트 | 256비트 | 256비트 | 2048비트 | 2048비트 | 256비트 |
계산 속도(FP32) | 48 TFLOP | 61.3 TFLOPs | 45.2 TFLOPs | 22.23 TFLOPs | 17.82 TFLOPs | 13.1 TFLOPs | 9.5 TFLOPs | 8.89 TFLOPs | 12.3 TFLOP | 10.8 TFLOPs | 5.7 TFLOP |
열전력 | 300와트 | 295와트 | 260와트 | 300와트 | 250와트 | 250와트 | 240와트 | 205와트 | 250와트 | 230와트 | 150와트 |
가격 | 미정 | 3999달러 | 2499달러 | 5999달러 | 2249달러 | 1899달러 | 999달러 | 799달러 | 2199달러 | 999달러 | 799달러 |
시작하다 | 2025 | 2023 | 2023 | 2021 | 2021 | 2020 | 2019 | 2019 | 2017 | 2018 | 2016 |
답글 남기기