AMD Instinct MI400 가속기: 40 PFLOP 컴퓨팅 성능, 19.6TB/s의 432GB HBM4 메모리, 2026년 출시 예정

AMD Instinct MI400 가속기: 40 PFLOP 컴퓨팅 성능, 19.6TB/s의 432GB HBM4 메모리, 2026년 출시 예정

AMD는 최근 MI350 시리즈를 공개한 데 이어, 2026년 출시 예정인 차세대 Instinct MI400 시리즈에 대한 흥미로운 미리보기도 제공했습니다.

AMD Instinct MI400의 뛰어난 기능 강조

AMD의 Instinct MI400 가속기는 하드웨어 성능을 크게 향상시켜 MI350 시리즈보다 거의 두 배에 달하는 컴퓨팅 성능을 자랑합니다.공식 사양에 따르면 MI400은 FP4 연산에서 40 PFLOP, FP8 연산에서 20 PFLOP의 인상적인 성능을 제공하여 기존 MI350 시리즈보다 컴퓨팅 성능이 두 배 향상되었습니다.

AMD는 MI400 시리즈에서 HBM4 메모리 기술의 장점을 활용하고 있습니다.이 차세대 제품은 메모리 용량이 288GB HBM3e 에서 432GB HBM4 로 50% 증가했습니다. HBM4 표준은 MI350 시리즈의 8TB/ s 대역폭 보다 두 배 이상 빠른 19.6TB/s의 놀라운 대역폭을 제공합니다.또한, 각 GPU는 300GB/s의 스케일아웃 대역폭을 지원하여 차세대 Instinct 가속기의 성능이 크게 향상될 것으로 예상됩니다.

이전 발표에서 Instinct MI400 가속기에 대한 자세한 내용은 최대 4개의 가속 컴퓨팅 다이(XCD) 를 통합한 것으로 나타났는데, 이는 MI300 모델에 사용된 두 개의 XCD보다 훨씬 향상된 성능입니다.특히 MI400에는 두 개의 액티브 인터포저 다이(AID)가 포함되고 멀티미디어 다이와 I/O 다이가 분리되어 전반적인 기능과 효율성이 향상됩니다.

MI400 패치
이미지 출처: FreeDesktop.org

각 AID에는 전용 MID 타일이 장착되어 컴퓨팅 유닛과 I/O 인터페이스 간의 원활한 통신을 보장하며, 이는 이전 세대에 비해 향상된 기능입니다. MI350 시리즈는 이미 다이 간 통신을 위해 Infinity Fabric을 활용했으므로, MI400 아키텍처에서는 더욱 향상된 성능을 기대할 수 있습니다.

대규모 AI 작업 타겟팅

MI400 시리즈는 새로운 CDNA-Next 아키텍처를 활용하여 대규모 AI 학습 및 추론 작업에 대한 증가하는 수요를 충족하는 것을 목표로 합니다.이 아키텍처는 AMD의 RDNA 및 CDNA 아키텍처를 통합하기 위한 노력의 일환으로 UDNA로 리브랜딩될 수 있습니다.

AMD Instinct AI 가속기 비교

가속기 이름 AMD 인스팅트 MI400 AMD 인스팅트 MI350X AMD 인스팅트 MI325X AMD 인스팅트 MI300X AMD 인스팅트 MI250X
GPU 아키텍처 CDNA Next / UDNA 씨디엔에이 4 아쿠아 반자람(CDNA 3) 아쿠아 반자람(CDNA 3) 알데바란(CDNA 2)
GPU 프로세스 노드 미정 3nm 5nm+6nm 5nm+6nm 6nm
XCD(칩렛) 8(엠씨엠) 8(엠씨엠) 8(엠씨엠) 8(엠씨엠) 2(MCM), 1(Per Die)
GPU 코어 미정 미정 19, 456 19, 456 14, 080
GPU 클럭 속도 미정 미정 2100MHz 2100MHz 1700MHz
INT8 컴퓨팅 미정 미정 2614 탑스 2614 탑스 383 TOP
FP6/FP4 컴퓨팅 미정 20 PFLOP 해당 없음 해당 없음 해당 없음
FP8 컴퓨팅 미정 10 PFLOP 2.6 PFLOP 2.6 PFLOP 해당 없음
FP16 컴퓨팅 미정 5 PFLOP 1.3 PFLOP 1.3 PFLOP 383 TFLOPs
FP32 컴퓨팅 미정 미정 163.4 TFLOP 163.4 TFLOP 95.7 TFLOPs
FP64 컴퓨팅 미정 79 TFLOPs 81.7 TFLOPs 81.7 TFLOPs 47.9 TFLOPs
비디오램 미정 288 HBM3e 256GB HBM3e 192GB HBM3 128GB HBM2e
인피니티 캐시 미정 미정 256MB 256MB 해당 없음
메모리 클록 미정 8.0Gbps 5.9Gbps 5.2Gbps 3.2Gbps
메모리 버스 미정 8192비트 8192비트 8192비트 8192비트
메모리 대역폭 미정 8TB/초 6.0TB/초 5.3TB/초 3.2TB/초
폼 팩터 미정 오엠 오엠 오엠 오엠
냉각 미정 수동 냉각 수동 냉각 수동 냉각 수동 냉각
TDP(최대) 미정 1400W(355X) 1000와트 750와트 560와트

더욱 자세한 정보와 통찰력을 얻으려면 AMD의 다가올 혁신에 대한 전체 기사를 읽어보세요.

출처 및 이미지

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다