M3 Ultra DeepSeek R1: 671 miliardów parametrów, 448 GB pamięci zunifikowanej, wysoka przepustowość poniżej 200 W, brak konieczności stosowania wielu procesorów graficznych

M3 Ultra DeepSeek R1: 671 miliardów parametrów, 448 GB pamięci zunifikowanej, wysoka przepustowość poniżej 200 W, brak konieczności stosowania wielu procesorów graficznych

Wcześniej w tym tygodniu Apple zaprezentowało najnowszą wersję swojego Mac Studio, teraz zasilaną przez najnowocześniejszy układ M3 Ultra. Ten innowacyjny procesor nie tylko redefiniuje standardy wydajności, ale także przewyższa własne punkty odniesienia Apple, oferując imponującą konfigurację do 32-rdzeniowego procesora CPU i 80-rdzeniowego procesora GPU. Ta kombinacja znacznie zwiększa zarówno możliwości obliczeniowe, jak i graficzne w porównaniu z poprzednikiem, M2 Ultra. Ponadto M3 Ultra wykazał swoją siłę, bez wysiłku obsługując model DeepSeek R1, który może pochwalić się oszałamiającymi 671 miliardami parametrów.

Rewolucja w wydajności: możliwości układu M3 Ultra

Model DeepSeek R1 o pojemności 404 GB wymaga pamięci o dużej przepustowości, zwykle kojarzonej z pamięcią VRAM GPU. Tym, co wyróżnia M3 Ultra firmy Apple, jest jego zunifikowana architektura pamięci, która efektywnie przydziela zasoby, utrzymując jednocześnie niskie zużycie energii. Niedawna analiza kanału YouTube Dave2D dostarcza informacji na temat tego, w jaki sposób ta architektura podnosi wydajność, zwłaszcza w porównaniu z wcześniejszymi modelami krzemowymi Apple.

W przeciwieństwie do tego, tradycyjne konfiguracje komputerów PC zwykle wymagają wielu wysokiej klasy procesorów graficznych, aby wydajnie obsługiwać takie rozbudowane modele AI, co znacznie zwiększa zużycie energii. Jednak układ M3 Ultra działa skutecznie z dużo większą wydajnością. Jest to przypisywane jego wspólnej puli zasobów pamięci o dużej przepustowości, która pozwala złożonym modelom AI wykorzystywać zasoby pamięci w sposób podobny do VRAM, zapewniając tym samym optymalną wydajność.

Test wydajności układu Apple M3 Ultra z modelem DeepSeek R1

Należy zauważyć, że podczas gdy mniejsze modele AI działają płynnie i wydajnie bez wyczerpywania pełnych zasobów, gigantyczny DeepSeek R1 wymaga elitarnej konfiguracji układu M3 Ultra firmy Apple, wyposażonej w niezwykłe 512 GB pamięci. Jednak macOS ogranicza domyślną alokację pamięci VRAM; dlatego konieczne są zmiany — wykonywane przez zwiększenie limitu za pośrednictwem Terminala do 448 GB.

Pomimo tego, że jest to 4-bitowa wersja skwantowana, która poświęca pewną precyzję, model DeepSeek R1 działa znakomicie w ramach ograniczeń M3 Ultra Mac Studio, utrzymując swoje 671 miliardów parametrów. Pod względem zużycia energii M3 Ultra wyróżnia się, ponieważ cały system pobiera mniej niż 200 W podczas wykonywania tego modelu intensywnie wykorzystującego zasoby. To zapotrzebowanie na energię stanowi niewielką część tego, czego wymagałyby tradycyjne systemy multi-GPU, aby osiągnąć podobne poziomy wydajności, a Dave zauważył, że takie konfiguracje mogą potencjalnie wymagać dziesięciokrotnie większego zużycia energii niż układ M3 Ultra.

Analiza wydajności układu M3 Ultra

Co ciekawe, model R1 z jego ogromnymi 671 miliardami parametrów wykazał lepszą wydajność w porównaniu do mniejszych iteracji, takich jak model z 70 miliardami parametrów, prawdopodobnie ze względu na architektoniczną wydajność inherentną w projekcie M3 Ultra. Ogólnie rzecz biorąc, układ M3 Ultra firmy Apple wyłania się jako potężny pretendent zdolny do zarządzania rozległymi modelami AI znacznie wykraczającymi poza konwencjonalne oczekiwania. Przewidujemy, że dostarczymy więcej informacji na temat wydajności i efektywności tego niezwykłego układu, więc bądźcie czujni, aby uzyskać więcej aktualizacji.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *