NVIDIA erzielt 35-fachen Durchbruch bei KI-Inferenz – deutlich vor dem geplanten Termin – während Foxconn die Groq 3 LPX-Racks für Modelle mit Billionen von Parametern beschleunigt.

Foxconn wurde als Hauptlieferant für NVIDIAs neu vorgestellten Groq 3 LPX-Chip ausgewählt, einen fortschrittlichen Prozessor, der speziell zur deutlichen Verbesserung der KI-Inferenzfähigkeiten entwickelt wurde.

Auf der GTC 2026 stellte NVIDIA den Groq 3 LPX-Chip zusammen mit der KI-Plattform Vera Rubin vor. Dieser neue Chip, eine sogenannte Logical Processing Unit (LPU), soll die Leistung von KI-Inferenzen um das beeindruckende 35-Fache steigern. Jedes Groq 3 LPX-Rack besteht aus 256 Chips mit jeweils 128 GB SRAM und 12 TB DDR5-Speicher und ist speziell für KI-Modelle mit mehreren Billionen Parametern ausgelegt.

Die Abbildung zeigt die Rubin GPU und die Groq 3 LPU nebeneinander und gibt Leistungsdaten wie 288 GB HBM4 und 500 MB SRAM an. Die Leistungskennzahlen lauten 50 PFLOPs (NVFP4) für die Rubin GPU und 1, 2 PFLOPs (FP8) für die Groq 3 LPU. — Prozessoren mit extrem hoher Leistungsfähigkeit vereint.

Das Bildmaterial des NVIDIA Groq 3 LPX Servers zeigt Spezifikationen wie „KI-Inferenz-Rechenleistung“ mit 315 PFLOPS, „SRAM-Kapazität“ von 128 GB und „Speicherbandbreite“ von 40 PB/s. — Spezifikationen für KI-Inferenzberechnungen.

Jüngsten Berichten taiwanesischer Medien zufolge liegen die Auslieferungen des Groq 3 LPX-Chips vor dem Zeitplan und sollen voraussichtlich im dritten Quartal 2026 beginnen. Dieser rasante Zeitplan unterstreicht NVIDIAs Engagement für die beschleunigte Entwicklung seiner Vera Rubin-Plattform, um die stark steigende Nachfrage nach anspruchsvollen KI-Inferenzlösungen zu decken – eine entscheidende Komponente für das aufstrebende Zeitalter der agentenbasierten KI.

NVIDIA erzielt mit seinem Groq 3 LPX-Gehäuse, dessen Auslieferung Berichten zufolge im dritten Quartal beschleunigt werden soll, bedeutende Fortschritte im Bereich der KI-Inferenz. Foxconn ist exklusiver Lieferant der Recheneinheit und spielt eine führende Rolle bei der Montage der LPX-Gehäuse, wodurch das Unternehmen direkt im Markt für KI-Inferenz konkurriert.

UDN

Die ersten Prognosen für die Lieferungen von Groq 3 LPX waren recht konservativ, aber aktualisierte Analysen der Lieferkette lassen darauf schließen, dass in diesem Jahr schätzungsweise 1, 5 Millionen Einheiten der LP30- und LP35-Chips – die integraler Bestandteil der LPX-Racks sind – ausgeliefert werden, wobei die Zahlen bis 2027 potenziell auf 2, 5 Millionen steigen könnten.

Laut diesen Analysen ist Foxconn der exklusive Lieferant des Groq 3 LPX-Computerträgers und führend in der Montage von LPX-Gehäusen. Die außergewöhnlich hohe Nachfrage nach NVIDIAs Vera-Rubin-Plattformen und Groq 3 LPX-Racks dürfte Foxconns Marktanteil in der zweiten Jahreshälfte von 55 % auf 60 % steigern und damit ein signifikantes Umsatzwachstum zur Folge haben.

Eine Präsentation mit dem Titel „NVIDIA Extreme Co-Design Delivering X-Factors Every Year“, die verschiedene Hardwarearchitekturen wie Blackwell, Rubin und Feynman sowie zugehörige NVLink-Modelle und CPUs für die Jahre 2024, 2026 und 2028 veranschaulicht. — NVIDIAs Roadmap für wichtige Hardwarearchitekturen.

Foxconn plant, im laufenden Jahr rund 6.000 Groq 3 LPX-Racks auszuliefern, weitere 10.000 Einheiten werden im Jahr 2027 erwartet. Zu beachten ist, dass diese Zahl die erwarteten LPX-Racks der nächsten Generation auf Basis von LP40-Chips, deren Auslieferung im nächsten Jahr beginnen soll, nicht berücksichtigt.

Die Vera Rubin „NVL72“-Racks sollen bis 2026 eine Produktionsmarke von 12.000 Einheiten erreichen. Zu den Hauptkunden zählen die Technologiekonzerne Google, Amazon AWS und Microsoft. Die Serienproduktion der Vera Rubin VR200 NVL72-Server wird voraussichtlich Ende des dritten Quartals 2026 anlaufen.

Aufgrund der hohen Marktnachfrage baut Foxconn seine Produktionskapazitäten für die neuesten KI-Server von NVIDIA weiter aus. CEO Liu Yangwei erklärte, das Unternehmen könne wöchentlich über 1.000 Serverschränke fertigen und wolle diese Kapazität bis Ende 2026 auf 2.000 Schränke erhöhen.

Quellen & Bilder

NVIDIA erzielt 35-fachen Durchbruch bei KI-Inferenz – deutlich vor dem geplanten Termin – während Foxconn die Groq 3 LPX-Racks für Modelle mit Billionen von Parametern beschleunigt.

Ähnliche Artikel:

Sony begründet Preiserhöhungen für PS5, PS5 Pro und PS Portal mit globalem wirtschaftlichem Druck in sechs weiteren Ländern

Intel macht ausrangierte CPU-Chips angesichts der steigenden Nachfrage nach KI zu profitablen Produkten.

Schreibe einen Kommentar Antwort abbrechen

NVIDIAs Vera-Rubin-Plattformen stehen mit Groq 3 LPX vor großen Fortschritten und treiben Foxconns Aktien auf Rekordhochs.

Ähnliche Artikel:

Schreibe einen Kommentar Antwort abbrechen