Groq의 추론 칩은 비용 효율성 측면에서 NVIDIA의 Blackwell보다 5배 뛰어나고, 처리 속도는 두 배 빠릅니다.

Groq의 추론 칩은 비용 효율성 측면에서 NVIDIA의 Blackwell보다 5배 뛰어나고, 처리 속도는 두 배 빠릅니다.

선도적인 컴퓨팅 인프라 제공업체인 네비우스(Nebius)의 전문가가 알파센스(AlphaSense)와의 대담에서 밝힌 바에 따르면, 인공지능(AI) 컴퓨팅 환경은 빠르게 진화하고 있습니다. AI 컴퓨팅 기능이 확장됨에 따라 NVIDIA는 첨단 그래픽 처리 장치(GPU)를 통해 업계를 선도하고 있습니다.그러나 특히 시장의 가격 모델이 변화함에 따라 대안들이 등장하고 있습니다.

변화하는 비용 지표 속에서 엔비디아 칩의 대안이 늘어나고 있다

AI 인프라 부문의 가격 책정 방식은 사용되는 GPU 유형과 용량을 사전 예약하는지 또는 온디맨드로 사용하는지에 따라 달라집니다.예를 들어, NVIDIA의 H100 GPU는 온디맨드 용량의 경우 시간당 2.95달러인 반면, 최신 H200 변형은 시간당 3.50달러입니다.최신 Blackwell B200은 시간당 4.90달러에서 6.50달러 사이의 가격으로 책정됩니다.

반대로, 조직이 1~2년 계약 기간 동안 최소 10, 000개의 GPU를 확보하는 방식으로 예약 용량을 선택하면 비용이 크게 절감됩니다.이러한 계약 방식에서는 H100은 시간당 1.5달러, H200은 2.2달러, B200은 최소 3.5달러로 가격이 책정됩니다.이처럼 비용이 급격히 절감되는 것은 운영 비용 관리에 있어 장기 계약의 전략적 이점을 보여줍니다.

NVIDIA H200 GPU

기업 환경의 변화: 추론과 토큰 기반 가격 책정의 부상

중요한 진전으로, NVIDIA는 2025년 말 Groq와 핵심 라이선스 계약을 체결했습니다.이는 NVIDIA의 역대 최대 규모 계약이며, AI 추론 기술에 대한 NVIDIA의 집중도를 더욱 강화하는 계기가 될 것입니다. Nebius 전문가의 분석에 따르면, 현재 기업 워크로드 요구 사항의 90~95%가 추론 작업입니다.이러한 변화는 기업들이 자체 소프트웨어를 개발하는 대신 사전 학습된 모델과 API를 활용하려는 추세가 증가하고 있음을 반영합니다.

더욱이, 학습에서 추론으로의 전환은 AI 인프라의 비용 구조에 대한 전면적인 재평가를 필요로 합니다.전문가는 이러한 변화하는 환경이 단순한 트렌드가 아니라 기업이 컴퓨팅 자원을 평가하고 배포하는 방식에 대한 근본적인 변화를 의미한다고 강조했습니다.

백만 토큰당 비용: NVIDIA와 Groq의 비교 분석

기업들이 이러한 새로운 비용 구조로 전환함에 따라 토큰당 가격 책정, 특히 백만 토큰당 가격 책정 방식이 점점 더 보편화되고 있습니다.주목할 만한 점은 Groq의 칩이 백만 토큰당 5~10센트라는 훨씬 경제적인 가격으로 제공된다는 것입니다.반면 NVIDIA의 B100, B200, B300과 같은 제품은 백만 토큰당 25센트로 훨씬 높은 가격에 판매됩니다.

Groq 칩은 비용 효율성 외에도 속도 면에서 NVIDIA의 제품보다 우수하며, 초당 최대 800개의 토큰을 처리할 수 있습니다.이는 NVIDIA GPU가 제공하는 초당 450개의 토큰보다 거의 두 배에 달하는 수치입니다.이러한 경제성과 성능의 조합으로 Groq는 시장에서 경쟁력을 확보하고 있습니다.

미터법 엔비디아(블랙웰 B200) 그로크 LPU
비용(토큰 100만 개당) 0.25달러 0.10달러 (60% 더 저렴함)
처리량(토큰/초) 450 800 (77% 더 빠름)
주요 업무량 고강도 훈련 / 기업 고속 추론

더 자세한 내용은 원문을 참조하십시오.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다