NVIDIA ujawnia szczegóły superukładu GB10 dla komputerów DGX AI: technologia 3 nm, 20 rdzeni procesora ARM v9.2, 1000 procesorów graficznych TOPS NVFP4 Blackwell, obsługa pamięci LPDDR5x-9400 i TDP 140 W

NVIDIA ujawnia szczegóły superukładu GB10 dla komputerów DGX AI: technologia 3 nm, 20 rdzeni procesora ARM v9.2, 1000 procesorów graficznych TOPS NVFP4 Blackwell, obsługa pamięci LPDDR5x-9400 i TDP 140 W

Firma NVIDIA niedawno zaprezentowała najnowocześniejszy układ GB10 Superchip, który wykorzystuje architekturę procesora graficznego Blackwell i stanowi podstawę działania najnowszych superkomputerów DGX AI Mini.

NVIDIA GB10 Superchip: rewolucyjny układ SoC i architektura GPU

W centrum uwagi znajduje się obecnie DGX Spark firmy NVIDIA, pionierski system wyposażony w układ GB10 Superchip, który stanowi znaczący krok w kierunku wejścia na rynek komputerów „AI PC”.Po jego ogłoszeniu wiele firm rozpoczęło tworzenie własnych platform komputerów AI PC wykorzystujących technologię GB10. Podczas konferencji Hot Chips 2025 firma NVIDIA szczegółowo omówiła układ GB10 Superchip, demonstrując, jak skutecznie skaluje on architekturę Blackwell w stacjach roboczych i programistycznych Mini.

Schemat architektury procesora graficznego NVIDIA Blackwell ze zintegrowaną platformą do przetwarzania danych.

DGX Spark został zaprojektowany jako miniaturowy superkomputer AI, zbudowany na bazie zaawansowanej architektury Blackwell.

Schemat budowy miniaturowego superkomputera AI z funkcjami technologii Blackwell i DGX Spark.

Główne cechy stacji roboczej DGX Spark

Stacja robocza DGX Spark wyróżnia się kilkoma wyjątkowymi cechami:

  • GB10 Grace Blackwell Superchip: zoptymalizowany pod kątem sztucznej inteligencji, nauki o danych, obliczeń, renderowania i wizualizacji.
  • 128 GB spójnej, ujednoliconej pamięci systemowej: umożliwia obsługę dużych modeli sztucznej inteligencji (AI) obejmujących nawet 200 miliardów parametrów i precyzyjne dostrajanie modeli obejmujących nawet 70 miliardów parametrów.
  • Sieć ConnectX-7: ułatwia połączenie między dwoma systemami DGX Spark, umożliwiając współpracę nad modelami obejmującymi do 405 miliardów parametrów.
  • System operacyjny DGX Base OS i pakiet oprogramowania NVIDIA AI: zapewniają płynne przesyłanie obciążeń między DGX Spark i DGX Cloud lub dowolną przyspieszoną infrastrukturą chmurową.
  • Wszechstronne opcje wdrożenia: Możliwość konfiguracji jako stacja robocza AI lub podłączona do sieci osobista chmura AI.
  • Ulepszone wrażenia użytkownika: Oferuje obsługę wyświetlaczy wielogłowicowych i różne opcje łączności.
  • Kompaktowa i energooszczędna konstrukcja: Pasuje wygodnie do każdego biurka i można go podłączyć do standardowego gniazdka ściennego.
Stacja robocza NVIDIA DGX Spark charakteryzuje się potężnymi możliwościami sztucznej inteligencji i kompaktową, wydajną konstrukcją.

Nurkowanie głębiej: Specyfikacja układu GB10 Superchip

Dokładniejsza analiza układu GB10 Superchip pokazuje, że jego układ System-on-Chip (SoC) został zaprojektowany z wykorzystaniem dwóch diletów: S-Dielet, który zawiera podsystem procesora i pamięci, oraz G-Dielet, dedykowany rdzeniowi GPU. Oba dilety wykorzystują zaawansowaną technologię pakowania 2.5D i są produkowane w najnowocześniejszym procesie technologicznym 3 nm firmy TSMC.

NVIDIA GB10 Superchip: specyfikacja wydajności AI obejmująca 20 rdzeni ARM i 128 GB pamięci.

Architektura procesora oparta jest na architekturze ARM v9.2 i obejmuje łącznie 20 rdzeni skonfigurowanych w dwa klastry. Każdy rdzeń korzysta z dedykowanej pamięci podręcznej L2 oraz wspólnej pamięci podręcznej L3 o pojemności 32 MB, współdzielonej przez klastry.

Karta specyfikacji NVIDIA GB10 zawierająca szczegóły dotyczące procesora, procesora graficznego i pamięci.

Część GPU układu, wykorzystująca architekturę GB100 Blackwell, działa jako zintegrowany układ GPU (iGPU) ze względu na umieszczenie go w tej samej obudowie. Oferuje zaawansowane funkcje, takie jak rdzenie Tensor piątej generacji z obsługą DLSS 4 oraz rdzenie RTX Ray Tracing, zapewniając imponującą moc obliczeniową do 31 teraflopów (TFLOP) dla obliczeń FP32 i 1000 TOPS dla obliczeń NVFP4 (FP4) dostosowanych do zastosowań AI. Dodatkowo, układ GPU zawiera 24 MB pamięci podręcznej L2, co zwiększa wydajność.

Jeśli chodzi o możliwości pamięciowe, układ NVIDIA GB10 Superchip obsługuje 256-bitową pamięć LPDDR5x (Unified Memory Architecture) z prędkością dostępu do 9400 MT/s, co przekłada się na imponującą przepustowość do 301 GB/s. Taka konfiguracja umożliwia maksymalną pojemność pamięci 128 GB. Jego wysokowydajna koherentna struktura jest dostrojona do protokołu koherencji CHI-E, zapewniając procesorowi graficznemu rozległą, łączną przepustowość systemu na poziomie 600 GB/s przez interfejs C2X.

Specyfikacja NVIDIA GB10: wyświetlacz, zabezpieczenia, TDP i szczegóły systemu operacyjnego z grafiką układu.

Dodatkowo GB10 posiada 16 MB pamięci podręcznej na poziomie systemu, zaprojektowanej jako pamięć L4 dla procesora, co sprzyja energooszczędnemu udostępnianiu danych między wieloma układami SoC. Interfejs C2C o wysokiej przepustowości i niskim poborze mocy wykorzystuje technologię NVLINK firmy NVIDIA.

Opcje łączności są solidne, z obsługą PCIe, USB i Ethernetu przez PCIe. Obsługuje do czterech wyświetlaczy jednocześnie (3 DisplayPort + 1 HDMI) w rozdzielczości do 4K przy 120 Hz w trybie DP Alt, a nawet 8K przy 120 Hz z HDMI 2.1a. Bezpieczeństwo jest również priorytetem, dzięki obsłudze Dual Secure Root, procesorom SROOT i OSROOT oraz kompatybilności zarówno z fTPM, jak i oddzielnym modułem TPM. Całkowita moc obliczeniowa (TDP) układu wynosi 140 W.

Schemat skalowalności GB10 z technologią NVIDIA ConnectX zapewniającą wydajność obliczeń wieloprocesorowych.

Skalowalność układu GB10 Superchip

Kolejną godną uwagi cechą superukładu GB10 jest jego skalowalność. Wiele układów GB10 można połączyć ze sobą za pomocą technologii ConnectX firmy NVIDIA, co zapewnia zwiększoną przepustowość, pasmo przenoszenia i pojemność pamięci DRAM, co jest kluczowe dla obsługi większych modeli AI. Każda karta sieciowa ConnectX łączy się z układem SoC GB10 za pośrednictwem interfejsu PCIe Gen5 x8, a urządzenia komunikują się za pośrednictwem sieci Ethernet.

Diagram współpracy między firmami NVIDIA i Mediatek, łączący architekturę CPU i GPU w celu zwiększenia wydajności.

NVIDIA opisuje układ SoC GB10 Superchip jako udane partnerstwo z Mediatek, wykorzystujące IP procesora Mediatek. Układ przeszedł szczegółowe modelowanie wydajności interakcji pamięci GPU z infrastrukturą pamięci Mediatek.

Komputer NVIDIA DGX Spark z wyświetlaczem optymalizującym wydajność sztucznej inteligencji i procesora graficznego dla programistów.

Przyszłe perspektywy superchipa GB10

Najbardziej ekscytującym aspektem układu GB10 Superchip jest jego potencjał dotarcia do rynków konsumenckich, takich jak laptopy i mini komputery. Doniesienia sugerują, że nadchodzące układy SoC N1X i N1 mogą stać się pierwszymi układami SoC firmy NVIDIA przeznaczonymi dla użytkowników indywidualnych, a GB10 daje przedsmak możliwości, jakie mogą zaoferować te układy.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *