Die Inferenzchips von Groq sind fünfmal kostengünstiger als NVIDIAs Blackwell und liefern doppelt so schnelle Ergebnisse.

Die Landschaft des KI-Computing entwickelt sich rasant, wie ein Experte von Nebius, einem führenden Anbieter von Recheninfrastruktur, in einem Gespräch mit AlphaSense erläuterte. Während die Rechenleistung von KI stetig wächst, dominiert NVIDIA mit seinen fortschrittlichen Grafikprozessoren (GPUs) weiterhin den Markt. Dennoch entstehen Alternativen, insbesondere da sich die Preisgestaltung im Markt verändert.

Wachsende Alternativen zu NVIDIA-Chips angesichts sich ändernder Kostenkennzahlen

Die Preisgestaltung im Bereich der KI-Infrastruktur hängt vom verwendeten GPU-Typ und davon ab, ob die Kapazität im Voraus gebucht oder bedarfsgesteuert benötigt wird. Beispielsweise kosten NVIDIAs H100-GPUs 2, 95 US-Dollar pro Stunde für bedarfsgesteuerte Kapazität, während die neuere Variante H200 3, 50 US-Dollar pro Stunde kostet. Die neuesten Blackwell B200-GPUs liegen preislich zwischen 4, 90 und 6, 50 US-Dollar pro Stunde.

Entscheiden sich Unternehmen hingegen für reservierte Kapazität mit einer Vertragslaufzeit von ein bis zwei Jahren – mit einer Mindestanzahl von 10.000 GPUs –, sinken die Kosten deutlich. In diesem Fall liegen die Preise bei 1, 50 US-Dollar pro Stunde für H100-Grafikkarten, 2, 20 US-Dollar für H200-Grafikkarten und mindestens 3, 50 US-Dollar für B200-Grafikkarten. Diese drastische Kostenreduzierung unterstreicht die strategischen Vorteile langfristiger Verträge für die Verwaltung der Betriebskosten.

Der Unternehmenswandel: Schlussfolgerungen und der Aufstieg tokenbasierter Preisgestaltung

In einer bedeutenden Entwicklung schloss NVIDIA Ende 2025 einen wegweisenden Lizenzvertrag mit Groq ab. Dies ist der bisher größte Deal des Unternehmens und unterstreicht dessen Fokus auf KI-Inferenztechnologie. Laut Einschätzungen des Nebius-Experten macht die Inferenz mittlerweile beeindruckende 90 bis 95 % aller Workload-Anforderungen in Unternehmen aus. Diese Entwicklung spiegelt den wachsenden Trend wider, dass Unternehmen vermehrt auf vortrainierte Modelle und APIs setzen, anstatt eigene Software zu entwickeln.

Darüber hinaus erfordert dieser Übergang vom Training zur Inferenz eine umfassende Neubewertung der Kostenstrukturen in der KI-Infrastruktur. Der Experte betonte, dass diese sich wandelnde Landschaft nicht nur ein Trend, sondern ein grundlegender Wandel in der Art und Weise darstellt, wie Unternehmen ihre IT-Ressourcen bewerten und einsetzen.

Kosten pro Million Token: Vergleichsanalyse von NVIDIA und Groq

Da Unternehmen auf diese neue Kostenstruktur umstellen, hat die Preisgestaltung pro Token – insbesondere pro Million Token – zunehmend an Bedeutung gewonnen. Bemerkenswerterweise bieten die Chips von Groq eine deutlich günstigere Alternative mit Preisen zwischen fünf und zehn Cent pro Million Token. Im Gegensatz dazu sind die Produkte von NVIDIA, wie beispielsweise der B100, B200 oder B300, mit 25 Cent pro Million Token deutlich teurer.

Neben ihrer Kosteneffizienz übertreffen die Chips von Groq die Alternativen von NVIDIA in puncto Geschwindigkeit: Sie erreichen eine Verarbeitungsleistung von bis zu 800 Token pro Sekunde – fast doppelt so viel wie die 450 Token pro Sekunde der NVIDIA-GPUs. Diese Kombination aus Erschwinglichkeit und Leistung positioniert Groq wettbewerbsfähig im Markt.

Metrisch	NVIDIA (Blackwell B200)	Groq LPU
Kosten (pro 1 Million Token)	0, 25 $	0, 10 $ (60 % günstiger)
Durchsatz (Token/Sek.)	450	800 (77 % schneller)
Primäre Arbeitsbelastung	Schwerlasttraining / Unternehmen	Hochgeschwindigkeits-Inferenz

Interview mit einem Mitarbeiter von NBIS darüber, warum alternative Inferenzchips die Dominanz von NVDA ( CRWV, GOOGL ) herausfordern : Der Experte merkt an, dass Inferenz mittlerweile etwa 90–95 % der Workloads in Unternehmen ausmacht, da die meisten Firmen auf APIs oder vortrainierte Modelle setzen… pic.twitter.com/qINeuptisu

— AlphaSense (@AlphaSenseInc) 23. April 2026

Für weitere Einzelheiten verweisen wir auf die Originalquelle.

Die Inferenzchips von Groq sind fünfmal kostengünstiger als NVIDIAs Blackwell und liefern doppelt so schnelle Ergebnisse.

Wachsende Alternativen zu NVIDIA-Chips angesichts sich ändernder Kostenkennzahlen

Der Unternehmenswandel: Schlussfolgerungen und der Aufstieg tokenbasierter Preisgestaltung

Kosten pro Million Token: Vergleichsanalyse von NVIDIA und Groq

Gerüchte um Qualcomms Rechenzentrums-CPUs tauchen auf, während sich Agentic AI rasant weiterentwickelt.

Die beste Glücks-Zusammenstellung für Sailor Piece-Charaktere