AMD는 NVIDIA와의 실리콘 포토닉스 경쟁 심화 속에서 MI500 코패키징 광학 부품 개발을 위해 GlobalFoundries와 파트너십을 체결했습니다.

AMD는 NVIDIA와의 실리콘 포토닉스 경쟁 심화 속에서 MI500 코패키징 광학 부품 개발을 위해 GlobalFoundries와 파트너십을 체결했습니다.

AMD(Advanced Micro Devices)는 차세대 AI 가속기인 Instinct MI500의 핵심 부품인 코패키지드 광학(CPO) 솔루션 개발을 위해 글로벌파운드리(GlobalFoundries)와 협력할 예정이다.

GlobalFoundries와 AMD, 차세대 코패키징 광학 소자 개발을 위한 협력

실리콘 포토닉스라고도 불리는 CPO(Co-Packaged Optics) 기술은 빛을 신호 전송에 활용함으로써 구리 배선에 대한 의존도를 획기적으로 줄였습니다.이 혁신 덕분에 CPO는 GPU와 같은 하드웨어 가속기와 직접 통합될 수 있어 상호 연결 지연 시간을 크게 단축하고 CPU와 GPU 간의 고대역폭 통신을 가능하게 합니다.이는 미래 AI 데이터 센터에 필수적인 요소입니다.

AMD와 NVIDIA는 차세대 AI 그래픽 처리 장치(GPU)에 CPO 기술을 활용하기 위해 박차를 가하고 있습니다. AMD의 이번 프로젝트에는 Instinct MI500 가속기를 위해 특별히 설계된 독자적인 MRM 기반 CPO 솔루션이 포함됩니다.이 프로젝트에 사용되는 광자 집적 회로(PIC)의 제조는 GlobalFoundries에서 담당하고, 패키징은 ASE에서 제공합니다.특히 AMD는 작년에 광자 기술 전문 기업인 Enosemi를 인수하여 CPO 기술 개발을 가속화했습니다.

이와 유사하게, NVIDIA는 차세대 Vera Rubin 가속기를 위해 자체 CPO PIC를 개발 중인 것으로 알려졌습니다.이 회로의 제조는 TSMC가 담당하고, SPIL은 패키징을 맡으며, 조립은 Foxconn의 자회사인 Foxconn Industrial Internet 에서 이루어질 예정입니다. Rubin Ultra 모델의 경우, Near-Package Optics(NPO)보다 CPO 구현이 우선시되고 있습니다.

NVIDIA는 향후 Feynman 세대 AI 가속기에 Co-Packaged Optics를 완전히 통합하여 NPO에 대한 의존도를 없앨 계획입니다.

AMD의 MI500 시리즈는 최첨단 2nm 제조 공정을 활용하여 주목할 만한 성능을 제공할 예정입니다.이는 2nm 기술을 사용하지만 MI500만큼 발전된 것은 아닌, 곧 출시될 MI400 시리즈를 능가하는 수준입니다. MI500 가속기는 최첨단 CDNA 6 아키텍처를 기반으로 하는 반면, MI400은 CDNA 5 아키텍처를 사용합니다.또한 MI500은 HBM4E 메모리를 탑재하여 이전 모델인 MI400(HBM4 메모리 사용) 대비 19.6TB/s를 초과하는 탁월한 메모리 대역폭을 제공할 것으로 기대됩니다.

이전의 추측과는 달리 AMD는 Instinct GPU에 대해 UDNA라는 새로운 브랜드로 전환하지 않고 기존 아키텍처 명명 규칙을 유지할 것이라고 확인했습니다.

'리더십 로드맵 확장'이라는 제목의 로드맵 이미지에는 2023년 출시 예정인 AMD Instinct GPU MI300A/X, 2024년 출시 예정인 MI325X, 2025년 출시 예정인 MI350 시리즈, 2026년 출시 예정인 MI400 시리즈, 그리고 2027년 출시 예정인 MI500 시리즈가 소개되어 있습니다.

AMD는 인스팅트 MI500 시리즈 출시를 통해 AI 성능 향상에 대한 상당한 약속을 하고 있으며, 4년 안에 AI 기능을 1000배 이상 향상시키겠다는 목표를 세웠습니다.이러한 야심찬 목표는 급증하는 AI 수요를 충족하고 경쟁력을 유지하는 데 매우 중요하며, 특히 경쟁사들이 기술 경쟁에 박차를 가하는 상황에서는 더욱 그렇습니다. MI500은 2027년 출시될 예정입니다.

AMD Instinct AI 가속기 개요

가속기 이름 AMD 인스팅트 MI500 AMD 인스팅트 MI400 AMD 인스팅트 MI350X AMD 인스팅트 MI325X AMD 인스팅트 MI300X AMD 인스팅트 MI250X
GPU 아키텍처 CDNA 6 CDNA 5 CDNA 4 아쿠아 반자람 (CDNA 3) 아쿠아 반자람 (CDNA 3) 알데바란(CDNA 2)
GPU 프로세스 노드 2나노미터 2nm+3nm 3nm 5nm+6nm 5nm+6nm 6nm
XCD(칩릿) 미정 8 (MCM) 8 (MCM) 8 (MCM) 8 (MCM) 2 (MCM) 1 (주사위당)
GPU 코어 미정 미정 16, 384 19, 456 19, 456 14, 080
GPU 클럭 속도(최대) 미정 미정 2400MHz 2100MHz 2100MHz 1700MHz
INT8 컴퓨팅 미정 미정 5200 탑스 2614 탑 2614 탑 383 탑
FP6/FP4 매트릭스 미정 40 PFLOPs 20 PFLOPs 해당 없음 해당 없음 해당 없음
FP8 매트릭스 미정 20 PFLOPs 5 PFLOPs 2.6 PFLOPs 2.6 PFLOPs 해당 없음
FP16 매트릭스 미정 10 PFLOPs 2.5 PFLOPs 1.3 PFLOPs 1.3 PFLOPs 383 TFLOPs
FP32 벡터 미정 미정 157.3 TFLOPs 163.4 TFLOPs 163.4 TFLOPs 95.7 TFLOPs
FP64 벡터 미정 미정 78.6 TFLOPs 81.7 TFLOPs 81.7 TFLOPs 47.9 TFLOPs
VRAM HBM4E 432GB HBM4 288GB HBM3e 256GB HBM3e 192GB HBM3 128GB HBM2e
인피니티 캐시 미정 미정 256MB 256MB 256MB 해당 없음
메모리 클록 미정 19.6 TB/s 8.0Gbps 5.9Gbps 5.2Gbps 3.2Gbps
메모리 버스 미정 미정 8192비트 8192비트 8192비트 8192비트
메모리 대역폭 미정 미정 8TB/s 6.0 테라바이트/초 5.3 테라바이트/초 3.2 테라바이트/초
폼 팩터 미정 미정 오암 오암 오암 오암
냉각 미정 수동/액체 수동/액체 수동 냉각 수동 냉각 수동 냉각
총전력(최대) 미정 미정 1400W (355X) 1000와트 750와트 560와트

더 자세한 정보를 원하시면 @jukan05 님 의 최신 업데이트를 참고하세요.

이미지 및 자세한 내용은 Wccftech 웹사이트를 방문하세요.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다