AMD wprowadza na rynek pierwszą kartę sieciową Pensando Pollara 400 AI „gotową do UEC”, osiągającą prędkość 400 GbE

Firma AMD niedawno zaprezentowała na targach Hot Chips 2025 swoją innowacyjną kartę sieciową Pensando Pollara 400 AI NIC, co oznacza wprowadzenie na rynek pierwszej w branży karty sieciowej AI zgodnej ze standardem Ultra Ethernet Consortium (UEC).

AMD zwiększa wydajność o 25% dzięki karcie sieciowej Pensando Pollara 400 AI 400GbE

Kontynuując swoje poprzednie osiągnięcia, AMD zaprezentowało w zeszłym roku kartę Pensando Pollara 400. Ta najnowocześniejsza karta sieciowa, zaprojektowana specjalnie dla systemów AI, oferuje imponującą przepustowość 400 Gb/s, co stawia ją w bezpośredniej konkurencji z kartą ConnectX-7 firmy NVIDIA. Jednak NVIDIA wprowadziła również na rynek bardziej zaawansowaną kartę ConnectX-8, oferującą imponującą prędkość 800 GbE w najnowszych systemach Blackwell Ultra.

Karta sieciowa AMD Pensando Pollara 400 AI; pierwsza w branży karta sieciowa Ultra Ethernet AI o przepustowości 400 Gb/s.

Pensando Pollara 400 oferuje szereg najnowocześniejszych funkcji:

Programowalny potok sprzętowy
Do 1, 25x większa wydajność
Przepustowość 400 Gb/s
Otwarta zgodność ekosystemu
Możliwości RDMA zgodne z UEC
Skrócony czas realizacji zadania
Wyjątkowa dostępność

Schemat architektury systemu AMD Instinct z Infinity Fabric i połączeniami przełączników PCIe.

Architektura rozwiązań Pensando Networking jest ściśle powiązana z istniejącymi architekturami centrów danych AMD, w szczególności z rodzinami EPYC i Instinct, które wykorzystują przełączniki PCIe w celu efektywnego łączenia kart sieciowych i procesorów.

AMD rozwija rozwiązania dla centrów danych za pomocą procesorów, procesorów graficznych i sprzętu sieciowego.

Co ważne, karta sieciowa Pensando działa bez przełącznika PCIe i łączy się bezpośrednio z gniazdem Gen5 x16. Podstawową architekturę przedstawiono na poniższym schemacie:

Schemat blokowy przedstawiający architekturę karty sieciowej AMD Pensando z połączeniem NOC i komponentami P4DMA.

Dzięki wykorzystaniu architektury P4 karta sieciowa Pensando Pollara 400 AI osiąga niezwykłą wydajność.

Schemat architektury AMD Pensando P4 pokazujący ścieżki przetwarzania pakietów i przepływu pamięci.

Do najważniejszych komponentów architektury należy silnik tabel (TE), który odpowiada za generowanie kluczy tabel z wektora nagłówka pakietu, a także za wykonywanie określonych operacji odczytu pamięci na podstawie typu danych.

Schemat komponentów potoku P4 przedstawiający generowanie kluczy silnika tabelarycznego i dostęp do pamięci.

Projekt obejmuje również Match Processing Unit (MPU), specjalistyczny procesor wykorzystujący zoptymalizowane kody operacji do manipulacji polami, umożliwiający obsługę odrębnych interfejsów pamięci, tabeli i PHV.

Schemat komponentów potoku P4 przedstawiający jednostkę przetwarzania dopasowań i interfejsy.

Ponadto innowacje takie jak funkcja translacji adresu wirtualnego na adres fizyczny (va2pa) jeszcze bardziej zwiększają wydajność systemu.

Schemat blokowy procesu translacji adresów wirtualnych na fizyczne w architekturze komputerowej.

Jeśli chodzi o operacje pamięci atomowej, AMD wdrożyło je obok systemów SRAM w celu uzyskania większej wydajności.

Udoskonalenia AMD w zakresie operacji atomowych – przegląd korzyści dla pamięci SRAM.

Spójność pamięci podręcznej potoku wykorzystuje logikę unieważniania/aktualizowania, zapewniając efektywne działanie spójności P4 na podstawie zakresu adresów.

Schemat udoskonaleń spójności pamięci podręcznej potoku z wyjaśnieniem logiki unieważniania/aktualizowania.

AMD identyfikuje kilka wyzwań wpływających na wydajność systemów AI w sieciach skalowalnych. Problemy takie jak nieefektywne wykorzystanie łączy związane z równoważeniem obciążenia ECMP, przeciążenie sieci i utrata pakietów obniżają ogólną efektywność.

Skalowalna sieć AI: wyzwania związane z wydajnością systemu i problemy sieciowe, takie jak przeciążenie i utrata pakietów.

Firma podkreśla również, że sieci AI charakteryzują się znacznie wyższymi wskaźnikami wykorzystania w porównaniu z sieciami ogólnego przeznaczenia, co często przekracza granice dostępnej przepustowości sieci.

Wysokie wykorzystanie sieci: sieci zaplecza AI obsługują transfery danych przy wykorzystaniu na poziomie 95%.

AMD przedstawia Ultra Ethernet Consortium (UEC) jako kluczowe rozwiązanie pozwalające pokonać te przeszkody. UEC promuje otwarte, interoperacyjne i wydajne środowisko, zaprojektowane z myślą o spełnieniu wymagań sieciowych niezbędnych dla aplikacji AI i obliczeń o wysokiej wydajności (HPC) na dużą skalę.

Ultra Ethernet Consortium: Otwarta, skalowalna, ekonomiczna sieć Ethernet na potrzeby sztucznej inteligencji i obliczeń o wysokiej wydajności (HPC).

Sieć UEC została zaprojektowana z myślą o wydajności i przystępności cenowej. Ma ona sprostać wysokim wymaganiom, jakie coraz częściej stawia się nowoczesnym sieciom danych.

Karta sieciowa AMD Pensando Pollara 400 AI z obsługą RDMA, transportem UEC AI, kontrolą przeciążenia i szybkim odzyskiwaniem danych.

Dodatkowe zalety UEC obejmują udoskonalone techniki routingu i rozwiązania do zarządzania siecią, zaprojektowane z myślą o rozwiązywaniu problemów związanych z przeciążeniem i utratą pakietów.

Wykres wydajności Pollara RDMA vs RoCEv2 RPC, pokazujący wzrost wydajności sieci.

Podsumowując, karta sieciowa RDMA Pensando Pollara 400 AI UEC-ready firmy AMD zapewnia o 25% lepszą wydajność w porównaniu z RoCEv2 z 4 parami Q, a także zauważalny wzrost o 40% w porównaniu z RoCEv2 z 1 parą Q, co umacnia jej pozycję lidera w dziedzinie technologii sieciowych.

Źródło i obrazy

Powiązane artykuły:

Karta graficzna AMD Instinct MI350: Uwolnij moc sztucznej inteligencji dzięki 3-nanometrowemu chipletowi 3D, architekturze CDNA 4, 185 miliardom tranzystorów, 1400 W TBP i 288 GB pamięci obsługującej ponad 4000 B LLM

AMD wprowadza na rynek pierwszą kartę sieciową Pensando Pollara 400 AI „gotową do UEC”, osiągającą prędkość 400 GbE

AMD zwiększa wydajność o 25% dzięki karcie sieciowej Pensando Pollara 400 AI 400GbE

Powiązane artykuły:

Karta graficzna AMD Instinct MI350: Uwolnij moc sztucznej inteligencji dzięki 3-nanometrowemu chipletowi 3D, architekturze CDNA 4, 185 miliardom tranzystorów, 1400 W TBP i 288 GB pamięci obsługującej ponad 4000 B LLM

AMD współpracuje z IBM w celu rozwoju superkomputerów kwantowych: pionier nowej ery w obliczeniach

Dodaj komentarz Anuluj pisanie odpowiedzi