AMD, 2026년 MI400 가속기 “MI455X 및 MI430X” 출시, 2027년 출시 예정인 MI500으로 엔비디아 AI 리더십에 도전할 준비

AMD는 곧 출시될 Instinct MI400 및 MI500 시리즈로 AI 가속기 시장에서 큰 도전에 나설 준비를 하고 있으며, NVIDIA의 현재 지배력과 경쟁할 수 있는 입지를 굳건히 하고 있습니다.

AMD MI400 시리즈 공개: 2027년형 모델 및 기능

AMD는 2025년 파이낸셜 애널리스트 데이에서 곧 출시될 MI400 및 MI500 시리즈 AI GPU 가속기를 선보이며, 회사의 장기적인 AI 전략에서 이 제품들이 차지하는 역할을 강조했습니다.이 연례 출시 주기는 NVIDIA가 AI 분야를 지속적으로 선도하는 가운데, AMD의 입지를 더욱 공고히 하기 위해 마련되었습니다.

AMD Instinct: MI300~MI500 시리즈 사양을 포함한 데이터 센터 GPU 아키텍처 로드맵

내년에 출시될 예정인 MI400 시리즈는 여러 가지 향상된 기능을 약속합니다.

향상된 HBM4 용량 및 대역폭
처리량 증가로 더욱 광범위한 AI 형식 지원
표준화된 랙 스케일 네트워킹(UALoE, UAL, UEC)

MI400 시리즈는 40 PFLOPS(FP4) 및 20 PFLOPS(FP8)를 달성할 것으로 예상되며, 현재 인기 있는 MI350 시리즈의 연산 처리량을 효과적으로 두 배로 늘릴 수 있습니다.

AMD Instinct MI450 시리즈의 주요 사양은 '40 PF', '432GB' HBM4 메모리, '3.6TB/s' 대역폭 등입니다.

또한 MI400 시리즈는 HBM4 메모리 기술을 활용하여 기존 288GB HBM3e에서 50% 증가한 432GB HBM4 메모리 용량을 제공합니다.이러한 업그레이드를 통해 19.6TB/s라는 놀라운 메모리 대역폭을 확보하여 MI350 시리즈의 8TB/s를 크게 능가합니다.이 시리즈의 각 GPU는 300GB/s의 스케일아웃 대역폭을 자랑하며, 이는 AMD의 차세대 Instinct 라인업에 있어 획기적인 도약을 의미합니다.

비교 차트: MI450 시리즈와 Nvidia Vera Rubin의 랙 스케일 성능 리더십 비교

NVIDIA의 Vera Rubin과 비교했을 때, AMD의 Instinct MI400 GPU는 주목할 만한 장점을 보여줍니다.

경쟁사 대비 1.5배 메모리 용량
동등 메모리 대역폭 및 FLOP(FP4/FP8)
1.5배 더 큰 확장 대역폭

AI 학습 및 추론을 위한 MI455X와 HPC를 위한 MI430X를 선보이는 AMD Instinct MI400 시리즈 포트폴리오

MI400 시리즈는 두 가지 주요 모델로 구성됩니다.확장 가능한 AI 학습 및 추론 워크로드를 타겟으로 하는 MI455X와 HPC 및 Sovereign AI 작업을 위해 설계된 MI430X로, 하드웨어 기반 FP64 기능, 하이브리드 컴퓨팅(CPU+GPU)을 갖추고 있으며, 기존 제품과 동일한 HBM4 메모리를 유지합니다.

AMD Instinct: MI300부터 MI500 시리즈까지의 데이터 센터 GPU 아키텍처 로드맵

AMD는 2027년을 내다보며 Instinct MI500 시리즈를 출시하고 매년 제품 교체 주기를 이어갈 예정입니다.이 전략은 NVIDIA의 표준 및 “울트라” 버전 제공 방식에 발맞춰 데이터센터 AI 기술의 빠른 발전을 목표로 합니다. MI500 시리즈는 컴퓨팅, 메모리 및 상호 연결 기능을 크게 향상시켜 AI 분야에서 AMD의 경쟁력을 더욱 강화할 것으로 예상됩니다.

AMD Instinct AI 가속기 비교

가속기 이름	AMD 인스팅트 MI500	AMD 인스팅트 MI400	AMD 인스팅트 MI350X	AMD 인스팅트 MI325X	AMD 인스팅트 MI300X	AMD 인스팅트 MI250X
GPU 아키텍처	CDNA 넥스트 / UDNA	씨디엔에이 5	씨디엔에이 4	아쿠아 반자람(CDNA 3)	아쿠아 반자람(CDNA 3)	알데바란(CDNA 2)
GPU 프로세스 노드	미정	미정	3nm	5nm+6nm	5nm+6nm	6nm
XCD(칩렛)	미정	8 (엠씨엠)	8 (엠씨엠)	8 (엠씨엠)	8 (엠씨엠)	2(MCM; 다이당 1개)
GPU 코어	미정	미정	16, 384	19, 456	19, 456	14, 080
GPU 클럭 속도(최대)	미정	미정	2400MHz	2100MHz	2100MHz	1700MHz
INT8 컴퓨팅	미정	미정	5200 탑스	2614 탑스	2614 탑스	383 TOP
FP6/FP4 매트릭스	미정	40 PFLOP	20 PFLOP	해당 없음	해당 없음	해당 없음
FP8 매트릭스	미정	20 PFLOP	5 PFLOP	2.6 PFLOP	2.6 PFLOP	해당 없음
FP16 매트릭스	미정	10 PFLOP	2.5 PFLOP	1.3 PFLOP	1.3 PFLOP	383 TFLOPs
FP32 벡터	미정	미정	157.3 TFLOPs	163.4 TFLOPs	163.4 TFLOPs	95.7 TFLOPs
FP64 벡터	미정	미정	78.6 TFLOPs	81.7 TFLOPs	81.7 TFLOPs	47.9 TFLOPs
비디오램	미정	432GB HBM4	288GB HBM3e	256GB HBM3e	192GB HBM3	128GB HBM2e
인피니티 캐시	미정	미정	256MB	256MB	256MB	해당 없음
메모리 클록	미정	19.6TB/초	8.0Gbps	5.9Gbps	5.2Gbps	3.2Gbps
메모리 버스	미정	미정	8192비트	8192비트	8192비트	8192비트
메모리 대역폭	미정	미정	8TB/초	6.0TB/초	5.3TB/초	3.2TB/초
폼 팩터	미정	미정	오엠	오엠	오엠	오엠
냉각	미정	미정	수동 / 액체	수동 냉각	수동 냉각	수동 냉각
TDP(최대)	미정	미정	1400W(355X)	1000W	750W	560와트