끊임없이 진화하는 인공지능(AI) 환경에서 추론 솔루션은 컴퓨팅 제공업체들의 관심을 점점 더 많이 받고 있습니다.최근 NVIDIA와 Groq의 파트너십을 계기로 AI 커뮤니티는 기존 GPU를 넘어선 다양한 접근 방식의 필요성을 절감하게 되었습니다.이러한 배경에서 Intel과 SambaNova의 협력이 새롭게 떠오르고 있습니다.
인텔의 제온 6 CPU가 삼바노바의 SN50 칩을 이용한 추론 기능을 갖춘 에이전트 시스템의 호스트로 사용될 예정입니다.
최근 NVIDIA의 GTC 행사에서 분산형 추론 개념이 주목받았으며, NVIDIA는 순수 ‘GPU 중심’ 접근 방식에서 벗어나고 있음을 강조했습니다.이러한 전략은 다양한 고급 컴퓨팅 장치를 인프라에 통합하는 것을 포함합니다.이러한 변화는 Groq와의 라이선스 계약을 통해 더욱 두드러지게 나타나는데, Groq는 이를 통해 Rubin의 LPX 랙에 SRAM 기반 LPU를 통합했습니다. Intel과 SambaNova 또한 유사한 영역에 진출하여 SambaNova의 RDU와 Intel의 Xeon 6 CPU를 결합한 혁신적인 “추론 아키텍처”를 선보였습니다.
SambaNova는 Intel과의 협력 최신 단계를 발표했습니다.이 솔루션은 사전 작업용 GPU, 호스트 및 “액션” CPU 역할을 하는 Intel® Xeon® 6 프로세서, 그리고 디코딩을 위한 SambaNova RDU를 결합한 이기종 하드웨어 솔루션으로, 까다로운 에이전트형 AI 애플리케이션에 탁월한 추론 성능을 제공하는 것을 목표로 합니다.
– 삼바노바
이 협력 체계는 워크로드 최적화를 위해 전략적으로 설계되었으며, RDU는 디코딩 작업을 전담하고 GPU는 프리필 프로세스를 관리하며 Xeon 6 CPU는 오케스트레이션 및 일반 컴퓨팅 작업을 처리합니다.특히, 이 파트너십은 GPU 솔루션에 특정 하이퍼스케일러를 지정하지 않아 ASIC과의 통합 가능성을 열어두고 있습니다.그러나 SambaNova는 이 구성에서 GPU의 구체적인 성능 지표에 대해서는 자세히 설명하지 않았습니다.이 회사는 SN50 유닛이 “엔드투엔드 코딩 에이전트 워크플로우”를 구현하는 데 핵심적인 역할을 하며 ARM 기반 대안보다 우수하다고 강조합니다.

이제 SN50 칩의 세부 사항을 살펴보겠습니다.2026년 초에 발표된 이 솔루션은 SambaNova의 5세대 RDU 유닛을 특징으로 하며, DRAM, SRAM, HBM을 포함한 고급 메모리 기술을 통합합니다.2TB의 DDR5 메모리, 64GB의 HBM3, 그리고 520MB의 SRAM을 갖춘 이 아키텍처는 지연 시간을 최소화하면서 처리량과 용량을 극대화하도록 설계되었습니다. SambaNova에 따르면, DRAM, SRAM, HBM의 독특한 조합은 ‘에이전트 캐싱’이라고 부르는 기능을 구현하여 처리 효율성 측면에서 경쟁 우위를 제공합니다.

인텔과 삼바노바의 전략을 엔비디아의 전략과 비교해 보면 주목할 만한 차이점이 드러납니다.인텔의 파트너십은 보다 실용적인 접근 방식을 취하여, 분산 추론에 일반적으로 필요한 광범위한 기반 인프라 구축 요구 사항을 최소화합니다.이러한 특징 덕분에 인텔-삼바노바 솔루션은 “사전 데이터 입력 + 디코딩” 분할 문제를 효과적으로 해결하는 모듈형 랙 스케일 솔루션을 찾는 하이퍼스케일러에게 매력적입니다.
또한 인텔의 CEO는 초기 투자자인 립부 탄과 함께 삼바노바의 최근 투자 유치에 적극적으로 참여했습니다.인수 논의가 있었지만 이사회 의견 불일치로 무산되었고, 결국 인텔은 투자 참여자로 나서는 쪽을 택한 것으로 알려졌습니다.
답글 남기기