업계에서는 NVIDIA의 Groq LPU(지연 처리 장치) 기술에 대한 향후 전략에 대한 논의로 떠들썩합니다.최근 2026년 4분기 실적 발표에서 젠슨 황 CEO는 NVIDIA 기술 지형의 중요한 진화를 예고하는 흥미로운 개발 사항들을 암시했습니다.
NVIDIA의 Groq LPU: 지연 시간에 민감한 환경에서 리더십 강화
NVIDIA는 올해 공격적인 인수 전략을 펼쳤으며, 특히 최대 200억 달러 규모의 Groq와의 파트너십 체결이 주목할 만합니다.크리스마스 이브에 공개된 이 비라이선스 계약은 아직 구체적인 내용이 모두 공개되지는 않았습니다.그러나 젠슨 황 NVIDIA CEO는 실적 발표에서 Groq의 LPU가 NVIDIA의 미래 AI 계획에 어떻게 통합될 수 있는지에 대한 단서를 제공했습니다.
Groq와 저지연 디코더에 대한 우리의 생각과 관련하여, GTC에서 여러분과 공유하고 싶은 훌륭한 아이디어가 몇 가지 있습니다.
그래서 Groq를 통해 GTC를 선보일 예정인데, NVIDIA의 아키텍처를 Mellanox로 확장했던 방식과 매우 유사하게 Groq를 가속기로 활용하여 아키텍처를 확장 할 것입니다.
엔비디아 CEO 젠슨 황
Groq 인수의 핵심 목표는 오늘날 컴퓨팅 환경, 특히 AI 추론 분야에서 시급한 과제인 지연 시간에 민감한 워크로드 문제를 해결하는 데 있습니다. AI가 계속 발전함에 따라 초고속 응답 속도에 대한 요구가 증가하고 있으며, 이로 인해 지연 시간은 서비스 제공업체에게 매우 중요한 요소가 되었습니다. NVIDIA는 Hopper 및 Blackwell 아키텍처를 통해 학습 분야에서 탁월한 성과를 거두었지만, 곧 출시될 Vera Rubin 기술을 통해 추론 분야에서도 더욱 강력한 입지를 구축하고자 하며, Groq의 LPU 유닛은 이러한 전략에서 핵심적인 역할을 할 것으로 기대됩니다.
황 CEO는 Groq의 중요성을 과거 Mellanox 인수 사례에 비유하며, Mellanox 인수가 NVIDIA의 주요 네트워킹 문제를 해결했던 것처럼, Groq 또한 NVIDIA의 데이터 센터 전략을 위한 심층적인 공동 설계를 가능하게 했다고 언급했습니다.마찬가지로 Groq는 랙 규모의 LPU 통합을 통해 NVIDIA의 아키텍처를 향상시키고 AI 분야에서 NVIDIA의 입지를 강화할 것으로 기대됩니다.

인공지능(AI)에서 디코딩과 사전 데이터 입력은 추론의 핵심 단계이며, 특히 다중 에이전트 환경에서 디코딩의 중요성은 더욱 커지고 있습니다. AI 시스템이 더욱 긴밀하게 연결됨에 따라 정보를 빠르고 효율적으로 디코딩하는 능력이 필수적입니다. NVIDIA는 Groq LPU를 활용하여 이러한 기능을 강화하고자 합니다.놀라운 내부 대역폭을 제공하는 온칩 SRAM 기술의 통합은 이미 Cerebras와 Microsoft 같은 기업들의 구현 사례에서 볼 수 있듯이 큰 반향을 일으키고 있습니다.
NVIDIA 아키텍처에 Groq의 LPU를 통합하는 것과 관련하여 흥미로운 가능성이 있습니다.유력한 가설 중 하나는 NVIDIA가 통합 인터커넥트를 통해 연결된 여러 LPU를 특징으로 하는 하이브리드 컴퓨팅 노드를 구축하여 컴퓨팅 효율성을 향상시킬 수 있다는 것입니다.

GF Securities의 분석가들( Jukan을 통해 ) 에 따르면, NVIDIA는 다가오는 GTC 행사에서 최대 256개의 LPU 유닛을 단일 구성으로 탑재한 “LPX 랙”을 공개할 가능성이 있다고 합니다.분석가들은 NVIDIA가 내부 LPU 통신을 위해 네이티브 동기 프로토콜을 사용하고, 추론 과정에서 안정적인 GPU 데이터 처리를 위해 NVLink Fusion을 활용할 것으로 추측하고 있습니다.

궁극적으로 Groq의 LPU는 Mellanox가 네트워킹에 미친 혁신적인 영향을 재현할 잠재력을 지니고 있어 NVIDIA가 지연 시간에 민감한 애플리케이션에서 경쟁 우위를 확보할 수 있도록 해줍니다.황 CEO는 현재 AI 애플리케이션의 빠른 발전으로 컴퓨팅 성능과 매출 모두 상승세를 보이고 있다고 밝혔습니다.업계 관계자들은 다가오는 GTC 컨퍼런스에서 이러한 기술 발전이 공식적으로 발표될 것을 기대하고 있습니다.
답글 남기기