AMD(Advanced Micro Devices)는 차세대 AI 가속기인 Instinct MI500의 핵심 부품인 코패키지드 광학(CPO) 솔루션 개발을 위해 글로벌파운드리(GlobalFoundries)와 협력할 예정이다.
GlobalFoundries와 AMD, 차세대 코패키징 광학 소자 개발을 위한 협력
실리콘 포토닉스라고도 불리는 CPO(Co-Packaged Optics) 기술은 빛을 신호 전송에 활용함으로써 구리 배선에 대한 의존도를 획기적으로 줄였습니다.이 혁신 덕분에 CPO는 GPU와 같은 하드웨어 가속기와 직접 통합될 수 있어 상호 연결 지연 시간을 크게 단축하고 CPU와 GPU 간의 고대역폭 통신을 가능하게 합니다.이는 미래 AI 데이터 센터에 필수적인 요소입니다.
#산업정보 업데이트 1) 광 모듈 성능은 2분기에 가속화될 것으로 예상됩니다.이선(Easun)의 1분기 신소재 출하량은 4분기 대비 두 배 증가했습니다.솔베이(Solvay), 캠브리지(Cambridge), 럭스쉐어(Luxshare)가 새로운 메타 경쟁업체로 부상할 것으로 예상됩니다.2) 루빈 울트라(Rubin Ultra)의 스케일업 광 솔루션은 CPO를 우선으로 하고 NPO를 백업으로 고려합니다.이전에는 연구개발 부서의 논의가 예상되었지만, 최근 내부 공급망 부서에 공식적으로 통보되었습니다.파인만 울트라(Feynman Ultra)의 솔루션은 연구개발 및 설계를 시작했으며, 스케일업 단계에 접어들었습니다.
— 데일리 뉴스 플래시 (@dmjk001) 2026년 4월 19일
AMD와 NVIDIA는 차세대 AI 그래픽 처리 장치(GPU)에 CPO 기술을 활용하기 위해 박차를 가하고 있습니다. AMD의 이번 프로젝트에는 Instinct MI500 가속기를 위해 특별히 설계된 독자적인 MRM 기반 CPO 솔루션이 포함됩니다.이 프로젝트에 사용되는 광자 집적 회로(PIC)의 제조는 GlobalFoundries에서 담당하고, 패키징은 ASE에서 제공합니다.특히 AMD는 작년에 광자 기술 전문 기업인 Enosemi를 인수하여 CPO 기술 개발을 가속화했습니다.
이와 유사하게, NVIDIA는 차세대 Vera Rubin 가속기를 위해 자체 CPO PIC를 개발 중인 것으로 알려졌습니다.이 회로의 제조는 TSMC가 담당하고, SPIL은 패키징을 맡으며, 조립은 Foxconn의 자회사인 Foxconn Industrial Internet 에서 이루어질 예정입니다. Rubin Ultra 모델의 경우, Near-Package Optics(NPO)보다 CPO 구현이 우선시되고 있습니다.
NVIDIA는 향후 Feynman 세대 AI 가속기에 Co-Packaged Optics를 완전히 통합하여 NPO에 대한 의존도를 없앨 계획입니다.
AMD의 MI500 시리즈는 최첨단 2nm 제조 공정을 활용하여 주목할 만한 성능을 제공할 예정입니다.이는 2nm 기술을 사용하지만 MI500만큼 발전된 것은 아닌, 곧 출시될 MI400 시리즈를 능가하는 수준입니다. MI500 가속기는 최첨단 CDNA 6 아키텍처를 기반으로 하는 반면, MI400은 CDNA 5 아키텍처를 사용합니다.또한 MI500은 HBM4E 메모리를 탑재하여 이전 모델인 MI400(HBM4 메모리 사용) 대비 19.6TB/s를 초과하는 탁월한 메모리 대역폭을 제공할 것으로 기대됩니다.
이전의 추측과는 달리 AMD는 Instinct GPU에 대해 UDNA라는 새로운 브랜드로 전환하지 않고 기존 아키텍처 명명 규칙을 유지할 것이라고 확인했습니다.

AMD는 인스팅트 MI500 시리즈 출시를 통해 AI 성능 향상에 대한 상당한 약속을 하고 있으며, 4년 안에 AI 기능을 1000배 이상 향상시키겠다는 목표를 세웠습니다.이러한 야심찬 목표는 급증하는 AI 수요를 충족하고 경쟁력을 유지하는 데 매우 중요하며, 특히 경쟁사들이 기술 경쟁에 박차를 가하는 상황에서는 더욱 그렇습니다. MI500은 2027년 출시될 예정입니다.
AMD Instinct AI 가속기 개요
| 가속기 이름 | AMD 인스팅트 MI500 | AMD 인스팅트 MI400 | AMD 인스팅트 MI350X | AMD 인스팅트 MI325X | AMD 인스팅트 MI300X | AMD 인스팅트 MI250X |
|---|---|---|---|---|---|---|
| GPU 아키텍처 | CDNA 6 | CDNA 5 | CDNA 4 | 아쿠아 반자람 (CDNA 3) | 아쿠아 반자람 (CDNA 3) | 알데바란(CDNA 2) |
| GPU 프로세스 노드 | 2나노미터 | 2nm+3nm | 3nm | 5nm+6nm | 5nm+6nm | 6nm |
| XCD(칩릿) | 미정 | 8 (MCM) | 8 (MCM) | 8 (MCM) | 8 (MCM) | 2 (MCM) 1 (주사위당) |
| GPU 코어 | 미정 | 미정 | 16, 384 | 19, 456 | 19, 456 | 14, 080 |
| GPU 클럭 속도(최대) | 미정 | 미정 | 2400MHz | 2100MHz | 2100MHz | 1700MHz |
| INT8 컴퓨팅 | 미정 | 미정 | 5200 탑스 | 2614 탑 | 2614 탑 | 383 탑 |
| FP6/FP4 매트릭스 | 미정 | 40 PFLOPs | 20 PFLOPs | 해당 없음 | 해당 없음 | 해당 없음 |
| FP8 매트릭스 | 미정 | 20 PFLOPs | 5 PFLOPs | 2.6 PFLOPs | 2.6 PFLOPs | 해당 없음 |
| FP16 매트릭스 | 미정 | 10 PFLOPs | 2.5 PFLOPs | 1.3 PFLOPs | 1.3 PFLOPs | 383 TFLOPs |
| FP32 벡터 | 미정 | 미정 | 157.3 TFLOPs | 163.4 TFLOPs | 163.4 TFLOPs | 95.7 TFLOPs |
| FP64 벡터 | 미정 | 미정 | 78.6 TFLOPs | 81.7 TFLOPs | 81.7 TFLOPs | 47.9 TFLOPs |
| VRAM | HBM4E | 432GB HBM4 | 288GB HBM3e | 256GB HBM3e | 192GB HBM3 | 128GB HBM2e |
| 인피니티 캐시 | 미정 | 미정 | 256MB | 256MB | 256MB | 해당 없음 |
| 메모리 클록 | 미정 | 19.6 TB/s | 8.0Gbps | 5.9Gbps | 5.2Gbps | 3.2Gbps |
| 메모리 버스 | 미정 | 미정 | 8192비트 | 8192비트 | 8192비트 | 8192비트 |
| 메모리 대역폭 | 미정 | 미정 | 8TB/s | 6.0 테라바이트/초 | 5.3 테라바이트/초 | 3.2 테라바이트/초 |
| 폼 팩터 | 미정 | 미정 | 오암 | 오암 | 오암 | 오암 |
| 냉각 | 미정 | 수동/액체 | 수동/액체 | 수동 냉각 | 수동 냉각 | 수동 냉각 |
| 총전력(최대) | 미정 | 미정 | 1400W (355X) | 1000와트 | 750와트 | 560와트 |
더 자세한 정보를 원하시면 @jukan05 님 의 최신 업데이트를 참고하세요.
이미지 및 자세한 내용은 Wccftech 웹사이트를 방문하세요.
답글 남기기