최근 AMD는 차세대 프로세서에 L2 캐시를 스택형으로 통합하는 방법을 연구하고 있습니다.이 개발은 지연 시간 성능을 유지하거나 향상시키는 것을 목표로 합니다.
칩 설계의 발전: AMD의 적층형 L2 캐시 탐구
AMD는 특허 출원 번호와 관련된 ” 균형 잡힌 지연 시간 스택형 캐시 ” 라는 흥미로운 연구 논문을 발표했습니다 US20260003794A1.이 논문에서 AMD는 수직으로 적층된 최소 두 개의 캐시 다이를 포함하는 균형 잡힌 지연 시간 스택형 캐시 시스템에 대한 방법론을 설명합니다.

AMD는 코어 컴퓨팅 칩렛 위 또는 아래에 추가적인 L3 캐시 레이어를 배치하는 3D V-Cache 제품군에서 스택형 캐시 기술을 활용하는 것으로 이미 잘 알려져 있습니다.3D V-Cache의 첫 번째 버전은 Zen 컴퓨팅 칩렛 위에 위치했지만, 2세대에서는 이 구성을 뒤집어 컴퓨팅 칩렛 아래에 배치했습니다.전략은 동일하지만 실행 방식은 다릅니다.
AMD의 3D V-캐시(X3D) 기술은 소비자용 “라이젠” 제품군부터 데이터 센터용 고성능 “EPYC” 시리즈에 이르기까지 다양한 AMD 칩에 적용되고 있습니다. AMD는 L3 3D V-캐시 혁신을 지속해 온 가운데, 최근 특허를 통해 스택형 L2 캐시의 잠재력을 탐구함으로써 캐싱 기술을 확장할 준비를 마쳤습니다.

AMD는 적층형 L2 캐시 설계를 위해 컴퓨팅 다이와 캐시 다이가 통합된 기본 다이와 그 위에 추가 컴퓨팅 다이와 캐시 다이가 계층화된 구성을 보여줍니다.이 구성은 512KB 세그먼트 4개로 구성된 캐시 모듈을 보여주며, 총 2MB의 L2 캐시를 제공하고 캐시 제어 회로(CCC)에 의해 관리됩니다.이 아키텍처는 확장성이 뛰어나 최대 4MB의 L2 캐시까지 설계가 가능하며, 이는 첨부된 블록 다이어그램에서 확인할 수 있습니다.

적층 전략은 3D V-캐시의 원리를 반영하여 L2 및 L3 캐시를 수직으로 정렬된 실리콘 비아를 통해 기본 다이 및 컴퓨팅 컴플렉스에 연결합니다. CCC는 이 시스템 전체의 데이터 흐름을 제어합니다.
AMD의 연구 결과에서 주목할 만한 점은 평면형과 적층형 구성 간의 지연 시간 비교입니다.연구에 따르면 평면형 1MB L2M 캐시는 일반적으로 14 사이클의 지연 시간을 발생시키지만, 적층형 버전은 이 지연 시간을 12 사이클로 줄입니다.따라서 적층형 L2 캐시 구성은 용량 증가를 지원할 뿐만 아니라 기존 평면형 구성과 비교하여 동일하거나 더 낮은 지연 시간을 달성합니다.

설명된 기술 측면에서, 스택형 캐시 시스템의 구성은 스택형 캐시에 접근할 때 응답 지연 시간을 줄여줄 뿐만 아니라 전력 절감 효과도 제공합니다.스택형 캐시 시스템은 데이터 전송 성능을 향상시키고, 단일 칩에 구축된 기존의 평면형 캐시보다 지연 시간이 짧습니다.특히, 연결 비아는 스택형 캐시 시스템의 중앙으로 들어가고 나옵니다.이는 기존의 평면형 캐시처럼 데이터를 캐시의 한 부분을 거쳐 데이터 I/O에서 더 멀리 떨어진 캐시 부분에 도달하도록 라우팅하기 위해 추가적인 배선 단계(파이프 단계라고도 함)를 추가하는 것을 방지합니다.
설명된 기술에서, 스택형 캐시 시스템의 중앙으로 라우팅되는 연결 비아는 스택형 다이 상의 두 부분(예: 첫 번째 캐시 다이와 적어도 두 번째 캐시 다이) 사이에 균형 잡힌(또는 동일한) 지연 시간을 생성합니다.예를 들어, 기존의 평면형 1MB L2M 캐시는 14 사이클의 지연 시간을 갖는 반면, 설명된 기술을 사용하여 구현된 스택형 1MB L2M 캐시는 12 사이클의 지연 시간만 갖습니다.이는 일반적인 평면형 캐시보다 더 큰 스택형 캐시를 구현하면서도 동일하거나 더 나은 사이클 지연 시간을 달성할 수 있도록 합니다.
따라서, 위에서 설명한 균형 지연 시간 스택형 캐시의 여러 측면은 액세스 요청에 대한 지연 시간을 줄여주고, 데이터 캐시에서 데이터를 더 빠르게 반환할 수 있도록 합니다.또한 액세스 요청이 더 적은 사이클 내에 처리되므로 전력 소모를 줄일 수 있습니다.예를 들어, L2 캐시가 켜져 있는 시간이 줄어들고, 캐시가 활성 상태에서 유휴 상태로 더 빨리 전환되므로 전력 소비도 절감됩니다.뿐만 아니라, 캐시 다이 내부의 배선 길이가 짧아져 실질적으로 정전 용량이 감소하고 전력 소모도 줄어듭니다.액세스 요청과 데이터 반환 시 신호 이동 거리가 절반으로 줄어들기 때문에 신호 부하도 감소합니다.더 나아가, 전력 절감, 정전 용량 감소, 신호 이동 거리 단축으로 인해 발열량도 감소합니다.
AMD는 지연 시간 단축을 넘어 적층형 L2 캐시 설계를 통해 얻는 에너지 효율성을 강조합니다.적층형 L2 캐시가 실제 하드웨어에 적용되는 것을 보려면 시간이 걸릴 수 있지만, 이 혁신 기술이 차세대 AMD 프로세서와 GPU에 탑재되어 칩 설계에 있어 더 큰 발전을 가져올 것이라는 기대감이 높습니다.
뉴스 출처: Kepler_L2
답글 남기기