
AMD는 최근 MI350 시리즈를 공개한 데 이어, 2026년 출시 예정인 차세대 Instinct MI400 시리즈에 대한 흥미로운 미리보기도 제공했습니다.
AMD Instinct MI400의 뛰어난 기능 강조
AMD의 Instinct MI400 가속기는 하드웨어 성능을 크게 향상시켜 MI350 시리즈보다 거의 두 배에 달하는 컴퓨팅 성능을 자랑합니다.공식 사양에 따르면 MI400은 FP4 연산에서 40 PFLOP, FP8 연산에서 20 PFLOP의 인상적인 성능을 제공하여 기존 MI350 시리즈보다 컴퓨팅 성능이 두 배 향상되었습니다.
AMD는 MI400 시리즈에서 HBM4 메모리 기술의 장점을 활용하고 있습니다.이 차세대 제품은 메모리 용량이 288GB HBM3e 에서 432GB HBM4 로 50% 증가했습니다. HBM4 표준은 MI350 시리즈의 8TB/ s 대역폭 보다 두 배 이상 빠른 19.6TB/s의 놀라운 대역폭을 제공합니다.또한, 각 GPU는 300GB/s의 스케일아웃 대역폭을 지원하여 차세대 Instinct 가속기의 성능이 크게 향상될 것으로 예상됩니다.
이전 발표에서 Instinct MI400 가속기에 대한 자세한 내용은 최대 4개의 가속 컴퓨팅 다이(XCD) 를 통합한 것으로 나타났는데, 이는 MI300 모델에 사용된 두 개의 XCD보다 훨씬 향상된 성능입니다.특히 MI400에는 두 개의 액티브 인터포저 다이(AID)가 포함되고 멀티미디어 다이와 I/O 다이가 분리되어 전반적인 기능과 효율성이 향상됩니다.

각 AID에는 전용 MID 타일이 장착되어 컴퓨팅 유닛과 I/O 인터페이스 간의 원활한 통신을 보장하며, 이는 이전 세대에 비해 향상된 기능입니다. MI350 시리즈는 이미 다이 간 통신을 위해 Infinity Fabric을 활용했으므로, MI400 아키텍처에서는 더욱 향상된 성능을 기대할 수 있습니다.
대규모 AI 작업 타겟팅
MI400 시리즈는 새로운 CDNA-Next 아키텍처를 활용하여 대규모 AI 학습 및 추론 작업에 대한 증가하는 수요를 충족하는 것을 목표로 합니다.이 아키텍처는 AMD의 RDNA 및 CDNA 아키텍처를 통합하기 위한 노력의 일환으로 UDNA로 리브랜딩될 수 있습니다.

AMD Instinct AI 가속기 비교
가속기 이름 | AMD 인스팅트 MI400 | AMD 인스팅트 MI350X | AMD 인스팅트 MI325X | AMD 인스팅트 MI300X | AMD 인스팅트 MI250X |
---|---|---|---|---|---|
GPU 아키텍처 | CDNA Next / UDNA | 씨디엔에이 4 | 아쿠아 반자람(CDNA 3) | 아쿠아 반자람(CDNA 3) | 알데바란(CDNA 2) |
GPU 프로세스 노드 | 미정 | 3nm | 5nm+6nm | 5nm+6nm | 6nm |
XCD(칩렛) | 8(엠씨엠) | 8(엠씨엠) | 8(엠씨엠) | 8(엠씨엠) | 2(MCM), 1(Per Die) |
GPU 코어 | 미정 | 미정 | 19, 456 | 19, 456 | 14, 080 |
GPU 클럭 속도 | 미정 | 미정 | 2100MHz | 2100MHz | 1700MHz |
INT8 컴퓨팅 | 미정 | 미정 | 2614 탑스 | 2614 탑스 | 383 TOP |
FP6/FP4 컴퓨팅 | 미정 | 20 PFLOP | 해당 없음 | 해당 없음 | 해당 없음 |
FP8 컴퓨팅 | 미정 | 10 PFLOP | 2.6 PFLOP | 2.6 PFLOP | 해당 없음 |
FP16 컴퓨팅 | 미정 | 5 PFLOP | 1.3 PFLOP | 1.3 PFLOP | 383 TFLOPs |
FP32 컴퓨팅 | 미정 | 미정 | 163.4 TFLOP | 163.4 TFLOP | 95.7 TFLOPs |
FP64 컴퓨팅 | 미정 | 79 TFLOPs | 81.7 TFLOPs | 81.7 TFLOPs | 47.9 TFLOPs |
비디오램 | 미정 | 288 HBM3e | 256GB HBM3e | 192GB HBM3 | 128GB HBM2e |
인피니티 캐시 | 미정 | 미정 | 256MB | 256MB | 해당 없음 |
메모리 클록 | 미정 | 8.0Gbps | 5.9Gbps | 5.2Gbps | 3.2Gbps |
메모리 버스 | 미정 | 8192비트 | 8192비트 | 8192비트 | 8192비트 |
메모리 대역폭 | 미정 | 8TB/초 | 6.0TB/초 | 5.3TB/초 | 3.2TB/초 |
폼 팩터 | 미정 | 오엠 | 오엠 | 오엠 | 오엠 |
냉각 | 미정 | 수동 냉각 | 수동 냉각 | 수동 냉각 | 수동 냉각 |
TDP(최대) | 미정 | 1400W(355X) | 1000와트 | 750와트 | 560와트 |
더욱 자세한 정보와 통찰력을 얻으려면 AMD의 다가올 혁신에 대한 전체 기사를 읽어보세요.
답글 남기기