AMD는 곧 출시될 Instinct MI400 및 MI500 시리즈로 AI 가속기 시장에서 큰 도전에 나설 준비를 하고 있으며, NVIDIA의 현재 지배력과 경쟁할 수 있는 입지를 굳건히 하고 있습니다.
AMD MI400 시리즈 공개: 2027년형 모델 및 기능
AMD는 2025년 파이낸셜 애널리스트 데이에서 곧 출시될 MI400 및 MI500 시리즈 AI GPU 가속기를 선보이며, 회사의 장기적인 AI 전략에서 이 제품들이 차지하는 역할을 강조했습니다.이 연례 출시 주기는 NVIDIA가 AI 분야를 지속적으로 선도하는 가운데, AMD의 입지를 더욱 공고히 하기 위해 마련되었습니다.

내년에 출시될 예정인 MI400 시리즈는 여러 가지 향상된 기능을 약속합니다.
- 향상된 HBM4 용량 및 대역폭
- 처리량 증가로 더욱 광범위한 AI 형식 지원
- 표준화된 랙 스케일 네트워킹(UALoE, UAL, UEC)
MI400 시리즈는 40 PFLOPS(FP4) 및 20 PFLOPS(FP8)를 달성할 것으로 예상되며, 현재 인기 있는 MI350 시리즈의 연산 처리량을 효과적으로 두 배로 늘릴 수 있습니다.

또한 MI400 시리즈는 HBM4 메모리 기술을 활용하여 기존 288GB HBM3e에서 50% 증가한 432GB HBM4 메모리 용량을 제공합니다.이러한 업그레이드를 통해 19.6TB/s라는 놀라운 메모리 대역폭을 확보하여 MI350 시리즈의 8TB/s를 크게 능가합니다.이 시리즈의 각 GPU는 300GB/s의 스케일아웃 대역폭을 자랑하며, 이는 AMD의 차세대 Instinct 라인업에 있어 획기적인 도약을 의미합니다.

NVIDIA의 Vera Rubin과 비교했을 때, AMD의 Instinct MI400 GPU는 주목할 만한 장점을 보여줍니다.
- 경쟁사 대비 1.5배 메모리 용량
- 동등 메모리 대역폭 및 FLOP(FP4/FP8)
- 1.5배 더 큰 확장 대역폭

MI400 시리즈는 두 가지 주요 모델로 구성됩니다.확장 가능한 AI 학습 및 추론 워크로드를 타겟으로 하는 MI455X와 HPC 및 Sovereign AI 작업을 위해 설계된 MI430X로, 하드웨어 기반 FP64 기능, 하이브리드 컴퓨팅(CPU+GPU)을 갖추고 있으며, 기존 제품과 동일한 HBM4 메모리를 유지합니다.

AMD는 2027년을 내다보며 Instinct MI500 시리즈를 출시하고 매년 제품 교체 주기를 이어갈 예정입니다.이 전략은 NVIDIA의 표준 및 “울트라” 버전 제공 방식에 발맞춰 데이터센터 AI 기술의 빠른 발전을 목표로 합니다. MI500 시리즈는 컴퓨팅, 메모리 및 상호 연결 기능을 크게 향상시켜 AI 분야에서 AMD의 경쟁력을 더욱 강화할 것으로 예상됩니다.
AMD Instinct AI 가속기 비교
| 가속기 이름 | AMD 인스팅트 MI500 | AMD 인스팅트 MI400 | AMD 인스팅트 MI350X | AMD 인스팅트 MI325X | AMD 인스팅트 MI300X | AMD 인스팅트 MI250X |
|---|---|---|---|---|---|---|
| GPU 아키텍처 | CDNA 넥스트 / UDNA | 씨디엔에이 5 | 씨디엔에이 4 | 아쿠아 반자람(CDNA 3) | 아쿠아 반자람(CDNA 3) | 알데바란(CDNA 2) |
| GPU 프로세스 노드 | 미정 | 미정 | 3nm | 5nm+6nm | 5nm+6nm | 6nm |
| XCD(칩렛) | 미정 | 8 (엠씨엠) | 8 (엠씨엠) | 8 (엠씨엠) | 8 (엠씨엠) | 2(MCM; 다이당 1개) |
| GPU 코어 | 미정 | 미정 | 16, 384 | 19, 456 | 19, 456 | 14, 080 |
| GPU 클럭 속도(최대) | 미정 | 미정 | 2400MHz | 2100MHz | 2100MHz | 1700MHz |
| INT8 컴퓨팅 | 미정 | 미정 | 5200 탑스 | 2614 탑스 | 2614 탑스 | 383 TOP |
| FP6/FP4 매트릭스 | 미정 | 40 PFLOP | 20 PFLOP | 해당 없음 | 해당 없음 | 해당 없음 |
| FP8 매트릭스 | 미정 | 20 PFLOP | 5 PFLOP | 2.6 PFLOP | 2.6 PFLOP | 해당 없음 |
| FP16 매트릭스 | 미정 | 10 PFLOP | 2.5 PFLOP | 1.3 PFLOP | 1.3 PFLOP | 383 TFLOPs |
| FP32 벡터 | 미정 | 미정 | 157.3 TFLOPs | 163.4 TFLOPs | 163.4 TFLOPs | 95.7 TFLOPs |
| FP64 벡터 | 미정 | 미정 | 78.6 TFLOPs | 81.7 TFLOPs | 81.7 TFLOPs | 47.9 TFLOPs |
| 비디오램 | 미정 | 432GB HBM4 | 288GB HBM3e | 256GB HBM3e | 192GB HBM3 | 128GB HBM2e |
| 인피니티 캐시 | 미정 | 미정 | 256MB | 256MB | 256MB | 해당 없음 |
| 메모리 클록 | 미정 | 19.6TB/초 | 8.0Gbps | 5.9Gbps | 5.2Gbps | 3.2Gbps |
| 메모리 버스 | 미정 | 미정 | 8192비트 | 8192비트 | 8192비트 | 8192비트 |
| 메모리 대역폭 | 미정 | 미정 | 8TB/초 | 6.0TB/초 | 5.3TB/초 | 3.2TB/초 |
| 폼 팩터 | 미정 | 미정 | 오엠 | 오엠 | 오엠 | 오엠 |
| 냉각 | 미정 | 미정 | 수동 / 액체 | 수동 냉각 | 수동 냉각 | 수동 냉각 |
| TDP(최대) | 미정 | 미정 | 1400W(355X) | 1000W | 750W | 560와트 |
답글 남기기