
Firma NVIDIA niedawno zaprezentowała najnowocześniejszy układ GB10 Superchip, który wykorzystuje architekturę procesora graficznego Blackwell i stanowi podstawę działania najnowszych superkomputerów DGX AI Mini.
NVIDIA GB10 Superchip: rewolucyjny układ SoC i architektura GPU
W centrum uwagi znajduje się obecnie DGX Spark firmy NVIDIA, pionierski system wyposażony w układ GB10 Superchip, który stanowi znaczący krok w kierunku wejścia na rynek komputerów „AI PC”.Po jego ogłoszeniu wiele firm rozpoczęło tworzenie własnych platform komputerów AI PC wykorzystujących technologię GB10. Podczas konferencji Hot Chips 2025 firma NVIDIA szczegółowo omówiła układ GB10 Superchip, demonstrując, jak skutecznie skaluje on architekturę Blackwell w stacjach roboczych i programistycznych Mini.

DGX Spark został zaprojektowany jako miniaturowy superkomputer AI, zbudowany na bazie zaawansowanej architektury Blackwell.

Główne cechy stacji roboczej DGX Spark
Stacja robocza DGX Spark wyróżnia się kilkoma wyjątkowymi cechami:
- GB10 Grace Blackwell Superchip: zoptymalizowany pod kątem sztucznej inteligencji, nauki o danych, obliczeń, renderowania i wizualizacji.
- 128 GB spójnej, ujednoliconej pamięci systemowej: umożliwia obsługę dużych modeli sztucznej inteligencji (AI) obejmujących nawet 200 miliardów parametrów i precyzyjne dostrajanie modeli obejmujących nawet 70 miliardów parametrów.
- Sieć ConnectX-7: ułatwia połączenie między dwoma systemami DGX Spark, umożliwiając współpracę nad modelami obejmującymi do 405 miliardów parametrów.
- System operacyjny DGX Base OS i pakiet oprogramowania NVIDIA AI: zapewniają płynne przesyłanie obciążeń między DGX Spark i DGX Cloud lub dowolną przyspieszoną infrastrukturą chmurową.
- Wszechstronne opcje wdrożenia: Możliwość konfiguracji jako stacja robocza AI lub podłączona do sieci osobista chmura AI.
- Ulepszone wrażenia użytkownika: Oferuje obsługę wyświetlaczy wielogłowicowych i różne opcje łączności.
- Kompaktowa i energooszczędna konstrukcja: Pasuje wygodnie do każdego biurka i można go podłączyć do standardowego gniazdka ściennego.

Nurkowanie głębiej: Specyfikacja układu GB10 Superchip
Dokładniejsza analiza układu GB10 Superchip pokazuje, że jego układ System-on-Chip (SoC) został zaprojektowany z wykorzystaniem dwóch diletów: S-Dielet, który zawiera podsystem procesora i pamięci, oraz G-Dielet, dedykowany rdzeniowi GPU. Oba dilety wykorzystują zaawansowaną technologię pakowania 2.5D i są produkowane w najnowocześniejszym procesie technologicznym 3 nm firmy TSMC.

Architektura procesora oparta jest na architekturze ARM v9.2 i obejmuje łącznie 20 rdzeni skonfigurowanych w dwa klastry. Każdy rdzeń korzysta z dedykowanej pamięci podręcznej L2 oraz wspólnej pamięci podręcznej L3 o pojemności 32 MB, współdzielonej przez klastry.

Część GPU układu, wykorzystująca architekturę GB100 Blackwell, działa jako zintegrowany układ GPU (iGPU) ze względu na umieszczenie go w tej samej obudowie. Oferuje zaawansowane funkcje, takie jak rdzenie Tensor piątej generacji z obsługą DLSS 4 oraz rdzenie RTX Ray Tracing, zapewniając imponującą moc obliczeniową do 31 teraflopów (TFLOP) dla obliczeń FP32 i 1000 TOPS dla obliczeń NVFP4 (FP4) dostosowanych do zastosowań AI. Dodatkowo, układ GPU zawiera 24 MB pamięci podręcznej L2, co zwiększa wydajność.
Jeśli chodzi o możliwości pamięciowe, układ NVIDIA GB10 Superchip obsługuje 256-bitową pamięć LPDDR5x (Unified Memory Architecture) z prędkością dostępu do 9400 MT/s, co przekłada się na imponującą przepustowość do 301 GB/s. Taka konfiguracja umożliwia maksymalną pojemność pamięci 128 GB. Jego wysokowydajna koherentna struktura jest dostrojona do protokołu koherencji CHI-E, zapewniając procesorowi graficznemu rozległą, łączną przepustowość systemu na poziomie 600 GB/s przez interfejs C2X.

Dodatkowo GB10 posiada 16 MB pamięci podręcznej na poziomie systemu, zaprojektowanej jako pamięć L4 dla procesora, co sprzyja energooszczędnemu udostępnianiu danych między wieloma układami SoC. Interfejs C2C o wysokiej przepustowości i niskim poborze mocy wykorzystuje technologię NVLINK firmy NVIDIA.
Opcje łączności są solidne, z obsługą PCIe, USB i Ethernetu przez PCIe. Obsługuje do czterech wyświetlaczy jednocześnie (3 DisplayPort + 1 HDMI) w rozdzielczości do 4K przy 120 Hz w trybie DP Alt, a nawet 8K przy 120 Hz z HDMI 2.1a. Bezpieczeństwo jest również priorytetem, dzięki obsłudze Dual Secure Root, procesorom SROOT i OSROOT oraz kompatybilności zarówno z fTPM, jak i oddzielnym modułem TPM. Całkowita moc obliczeniowa (TDP) układu wynosi 140 W.

Skalowalność układu GB10 Superchip
Kolejną godną uwagi cechą superukładu GB10 jest jego skalowalność. Wiele układów GB10 można połączyć ze sobą za pomocą technologii ConnectX firmy NVIDIA, co zapewnia zwiększoną przepustowość, pasmo przenoszenia i pojemność pamięci DRAM, co jest kluczowe dla obsługi większych modeli AI. Każda karta sieciowa ConnectX łączy się z układem SoC GB10 za pośrednictwem interfejsu PCIe Gen5 x8, a urządzenia komunikują się za pośrednictwem sieci Ethernet.

NVIDIA opisuje układ SoC GB10 Superchip jako udane partnerstwo z Mediatek, wykorzystujące IP procesora Mediatek. Układ przeszedł szczegółowe modelowanie wydajności interakcji pamięci GPU z infrastrukturą pamięci Mediatek.

Przyszłe perspektywy superchipa GB10
Najbardziej ekscytującym aspektem układu GB10 Superchip jest jego potencjał dotarcia do rynków konsumenckich, takich jak laptopy i mini komputery. Doniesienia sugerują, że nadchodzące układy SoC N1X i N1 mogą stać się pierwszymi układami SoC firmy NVIDIA przeznaczonymi dla użytkowników indywidualnych, a GB10 daje przedsmak możliwości, jakie mogą zaoferować te układy.
Dodaj komentarz