Die Landschaft des KI-Computing entwickelt sich rasant, wie ein Experte von Nebius, einem führenden Anbieter von Recheninfrastruktur, in einem Gespräch mit AlphaSense erläuterte. Während die Rechenleistung von KI stetig wächst, dominiert NVIDIA mit seinen fortschrittlichen Grafikprozessoren (GPUs) weiterhin den Markt. Dennoch entstehen Alternativen, insbesondere da sich die Preisgestaltung im Markt verändert.
Wachsende Alternativen zu NVIDIA-Chips angesichts sich ändernder Kostenkennzahlen
Die Preisgestaltung im Bereich der KI-Infrastruktur hängt vom verwendeten GPU-Typ und davon ab, ob die Kapazität im Voraus gebucht oder bedarfsgesteuert benötigt wird. Beispielsweise kosten NVIDIAs H100-GPUs 2, 95 US-Dollar pro Stunde für bedarfsgesteuerte Kapazität, während die neuere Variante H200 3, 50 US-Dollar pro Stunde kostet. Die neuesten Blackwell B200-GPUs liegen preislich zwischen 4, 90 und 6, 50 US-Dollar pro Stunde.
Entscheiden sich Unternehmen hingegen für reservierte Kapazität mit einer Vertragslaufzeit von ein bis zwei Jahren – mit einer Mindestanzahl von 10.000 GPUs –, sinken die Kosten deutlich. In diesem Fall liegen die Preise bei 1, 50 US-Dollar pro Stunde für H100-Grafikkarten, 2, 20 US-Dollar für H200-Grafikkarten und mindestens 3, 50 US-Dollar für B200-Grafikkarten. Diese drastische Kostenreduzierung unterstreicht die strategischen Vorteile langfristiger Verträge für die Verwaltung der Betriebskosten.

Der Unternehmenswandel: Schlussfolgerungen und der Aufstieg tokenbasierter Preisgestaltung
In einer bedeutenden Entwicklung schloss NVIDIA Ende 2025 einen wegweisenden Lizenzvertrag mit Groq ab. Dies ist der bisher größte Deal des Unternehmens und unterstreicht dessen Fokus auf KI-Inferenztechnologie. Laut Einschätzungen des Nebius-Experten macht die Inferenz mittlerweile beeindruckende 90 bis 95 % aller Workload-Anforderungen in Unternehmen aus. Diese Entwicklung spiegelt den wachsenden Trend wider, dass Unternehmen vermehrt auf vortrainierte Modelle und APIs setzen, anstatt eigene Software zu entwickeln.
Darüber hinaus erfordert dieser Übergang vom Training zur Inferenz eine umfassende Neubewertung der Kostenstrukturen in der KI-Infrastruktur. Der Experte betonte, dass diese sich wandelnde Landschaft nicht nur ein Trend, sondern ein grundlegender Wandel in der Art und Weise darstellt, wie Unternehmen ihre IT-Ressourcen bewerten und einsetzen.
Kosten pro Million Token: Vergleichsanalyse von NVIDIA und Groq
Da Unternehmen auf diese neue Kostenstruktur umstellen, hat die Preisgestaltung pro Token – insbesondere pro Million Token – zunehmend an Bedeutung gewonnen. Bemerkenswerterweise bieten die Chips von Groq eine deutlich günstigere Alternative mit Preisen zwischen fünf und zehn Cent pro Million Token. Im Gegensatz dazu sind die Produkte von NVIDIA, wie beispielsweise der B100, B200 oder B300, mit 25 Cent pro Million Token deutlich teurer.
Neben ihrer Kosteneffizienz übertreffen die Chips von Groq die Alternativen von NVIDIA in puncto Geschwindigkeit: Sie erreichen eine Verarbeitungsleistung von bis zu 800 Token pro Sekunde – fast doppelt so viel wie die 450 Token pro Sekunde der NVIDIA-GPUs. Diese Kombination aus Erschwinglichkeit und Leistung positioniert Groq wettbewerbsfähig im Markt.
| Metrisch | NVIDIA (Blackwell B200) | Groq LPU |
| Kosten (pro 1 Million Token) | 0, 25 $ | 0, 10 $ (60 % günstiger) |
| Durchsatz (Token/Sek.) | 450 | 800 (77 % schneller) |
| Primäre Arbeitsbelastung | Schwerlasttraining / Unternehmen | Hochgeschwindigkeits-Inferenz |
Interview mit einem Mitarbeiter von NBIS darüber, warum alternative Inferenzchips die Dominanz von NVDA ( CRWV, GOOGL ) herausfordern : Der Experte merkt an, dass Inferenz mittlerweile etwa 90–95 % der Workloads in Unternehmen ausmacht, da die meisten Firmen auf APIs oder vortrainierte Modelle setzen… pic.twitter.com/qINeuptisu
— AlphaSense (@AlphaSenseInc) 23. April 2026
Für weitere Einzelheiten verweisen wir auf die Originalquelle.
Schreibe einen Kommentar