AMD RDNA 4 살펴보기: Navi 44와 같은 소형 GPU를 위한 모듈식 SoC 설계 및 구성 가능성, 메모리 및 대역폭 효율성 제공

AMD RDNA 4 살펴보기: Navi 44와 같은 소형 GPU를 위한 모듈식 SoC 설계 및 구성 가능성, 메모리 및 대역폭 효율성 제공

AMD는 RDNA 4 GPU 아키텍처와 혁신적인 모듈형 SoC 디자인을 발전시켜 성능을 향상시키는 고급 메모리 및 대역폭 압축 전략을 도입했습니다.

Hot Chips 2025에서 AMD의 RDNA 4 GPU 아키텍처와 모듈형 SoC 혁신 재조명

2월 초, AMD는 RDNA 4 아키텍처에 대한 포괄적인 개요를 발표했습니다. Hot Chips 2025에서 최근 발표된 내용은 특히 다용도 애플리케이션을 위해 설계된 이 칩의 모듈식 특성에 대한 심도 있는 정보를 제공합니다.

AMD가 해결한 주목할 만한 측면 중 하나는 하위 계층 RDNA 4 GPU SoC에 LPDDR 메모리를 통합한 것입니다. LPDDR 메모리는 낮은 전력 소비로 잘 알려져 있지만, AMD는 필요한 대역폭이 부족하다고 지적합니다.결과적으로 칩의 물리적인 면적이 증가하여 LPDDR은 고성능 그래픽 카드에 적합하지 않게 됩니다.

Hot Chips 2025 이벤트에서 AMD RDNA 4 Radeon 9000 GPU가 출시되었으며, 칩의 자세한 모습이 보입니다.
RDNA 4 Vision: 향상된 성능과 레이트레이싱을 갖춘 게임에 최적화된 GPU 아키텍처입니다.
렌더링, 레이 트레이싱, 메모리를 강조하여 AMD Radeon RX 9070 XT 기능을 자세히 설명하는 다이어그램입니다.
AMD RDNA 4: 향상된 게임 스트리밍, 저지연 비디오, FreeSync 최적화 세부 정보.
RDNA 4 레이트레이싱 아키텍처: 향상된 가속기 및 최적화된 BVH 메모리 차트
히트맵 비교를 통한 지향형 경계 상자 및 순회 최적화에 대한 심층 분석
순서가 없는 메모리 대기열은 요청을 효율적으로 처리하여 RDNA 4 GPU 성능을 향상시킵니다.
RDNA 4 아키텍처는 다양한 최적화 요소를 통해 레이 트래버설 성능을 향상시킵니다.
셰이더에서 RDNA 3 정적 레지스터 할당과 RDNA 4 동적 레지스터 할당을 비교하는 그래프입니다.
게임 및 콘텐츠 제작을 위한 RDNA 4 AI 기능으로 효율성과 성능이 더욱 향상되었습니다.
다이어그램과 주요 차이점을 통해 레이트레이싱과 패스트레이싱 방법을 비교합니다.
다채로운 전구로 밝혀진 로봇과 기술 도구가 있는 아늑한 워크숍에서 RDNA 4 경로 추적을 선보입니다.

RDNA 3에 비해 감소된 메모리 대역폭에 대한 질문에 AMD는 메모리 대역폭 효율성이 특정 워크로드에 따라 크게 달라진다고 설명했습니다. RDNA 4 그래픽 아키텍처의 튜닝을 통해 성능 저하 없이 대역폭 요구 사항을 크게 줄일 수 있었습니다.

Hot Chips 프레젠테이션에서 AMD는 모듈러 SoC 아키텍처의 유연성을 강조했습니다. RDNA 4 모델은 다양한 라데온 제품에 맞춰 다양한 구성을 지원하는 다재다능한 칩으로 설계되었습니다. AMD SoC 설계자인 락스 파푸는 향후 RDNA 5 및 UDNA 세대로 확장될 것으로 예상되는 모듈러 기능을 강조했습니다.

추상적인 기하학적 디자인과 AMD 로고가 있는 RDNA 4 SoC 아키텍처 프레젠테이션 슬라이드입니다.

이 아키텍처는 Navi 4X SoC에 통합된 여러 셰이더 엔진을 특징으로 하는 데이터 흐름 차트를 활용하며, 각 셰이더 엔진은 듀얼 컴퓨트 유닛을 갖춘 여러 개의 작업 그룹 프로세서(WGP)로 구성됩니다.

이러한 구성 요소 간의 통신 네트워크는 GPU 측의 GL2 캐시를 통해 이루어지며, 이는 향상된 코히어런트 상호 연결 메커니즘인 인피니티 패브릭(Infinity Fabric)에 연결됩니다.이 모듈형 설계는 LLC와 함께 여러 개의 코히어런트 스테이션(Coherent Station)을 포함하고, PCB의 DRAM(GDDR6)에 직접 연결된 듀얼 채널 메모리 컨트롤러를 포함합니다.특히 인피니티 패브릭은 1.5GHz에서 2.5GHz의 주파수 범위에서 클록 사이클당 1KB의 메모리 용량으로 작동합니다.

셰이더 엔진과 Infinity Fabric 연결을 보여주는 SOC 아키텍처 데이터 흐름입니다.

AMD는 모듈형 SoC 설계에 집중하여 더 작은 SoC를 효율적으로 개발할 수 있는 잠재력을 강조했습니다. AMD 다이어그램에서 빨간색 선은 모듈형 칩의 세분화와 다양한 WeU에서의 확장성을 보여줍니다.예를 들어, 빨간색 선 아래의 구성은 두 개의 셰이더 엔진과 네 개의 GDDR6 메모리 컨트롤러를 갖춘 Navi 44 설계를 나타내며, 이를 통해 요구 사항에 따라 확장 또는 축소하는 양방향 조정이 가능합니다.

보안 기능과 구성 요소 레이아웃을 포함한 모듈식 SoC 아키텍처 개요, RDNA4 칩 강조.

모듈형 아키텍처는 RX 9070 XT 그래픽 카드에 탑재된 Navi 48과 같은 고급 WeU를 위해 더 많은 셰이더 엔진, L3 캐시, 인피니티 패브릭 인터커넥트, GDDR 메모리 컨트롤러를 추가할 수 있을 뿐만 아니라 보안 수준도 향상시킵니다.보안 관리, 전력 조절, 마이크로컨트롤러 기능에 대한 접근 제어 및 다양한 권한 수준을 제공합니다. RAS(안정성, 가용성, 서비스 가능성) 기능은 이 모듈형 다이의 다양한 구성 요소에 내장되어 있습니다.

SoC 아키텍처 최적화를 위한 중앙 압축/압축 해제 다이어그램

AMD는 또한 자사의 고급 RDNA 4 SoC 압축 및 압축 해제 알고리즘을 강조했습니다.이 새로운 방법론은 특정 래스터 워크로드에서 성능을 15% 향상시키고 패브릭 대역폭을 25% 절감하는 것으로 알려져 있습니다.이러한 효율성은 전력 소비를 줄일 뿐만 아니라, 압축 기능이 하드웨어 내에서 자체적으로 관리되기 때문에 소프트웨어의 압축 처리 필요성을 최소화합니다.

SOC RDNA 4 제품 SKU 개요, Radeon RX 9070 및 9060 시리즈 GPU 사양.

AMD는 모듈형 SoC 설계의 유연한 구성 가능성을 강조하며, 이를 통해 변화하는 시장 수요에 맞춰 다양한 제품 WeU를 구축할 수 있다고 밝혔습니다.사용 가능한 구성은 네 가지 수확 레벨로 구성됩니다.

  • SE하베스트
  • WGP 하베스트
  • 비대칭 수확(가중 픽셀 및 컴퓨트 셰이더 분포를 잠재적으로 통합)
  • 메모리 장치 수확(단일 장치 세분성 및 64비트 세분성)
게임과 창작을 위한 RDNA 4 기능을 갖춘 AMD Radeon RX 9070 XT GPU 세부 정보.

현재 AMD는 Navi 48 WeU 4개와 Navi 44 WeU 3개를 선보이고 있으며, RDNA 4의 확장 가능한 모듈형 SoC 특성은 향후 더 많은 구성의 길을 열어줍니다.

출처 및 이미지

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다