
Firma AMD niedawno zaprezentowała na targach Hot Chips 2025 swoją innowacyjną kartę sieciową Pensando Pollara 400 AI NIC, co oznacza wprowadzenie na rynek pierwszej w branży karty sieciowej AI zgodnej ze standardem Ultra Ethernet Consortium (UEC).
AMD zwiększa wydajność o 25% dzięki karcie sieciowej Pensando Pollara 400 AI 400GbE
Kontynuując swoje poprzednie osiągnięcia, AMD zaprezentowało w zeszłym roku kartę Pensando Pollara 400. Ta najnowocześniejsza karta sieciowa, zaprojektowana specjalnie dla systemów AI, oferuje imponującą przepustowość 400 Gb/s, co stawia ją w bezpośredniej konkurencji z kartą ConnectX-7 firmy NVIDIA. Jednak NVIDIA wprowadziła również na rynek bardziej zaawansowaną kartę ConnectX-8, oferującą imponującą prędkość 800 GbE w najnowszych systemach Blackwell Ultra.

Pensando Pollara 400 oferuje szereg najnowocześniejszych funkcji:
- Programowalny potok sprzętowy
- Do 1, 25x większa wydajność
- Przepustowość 400 Gb/s
- Otwarta zgodność ekosystemu
- Możliwości RDMA zgodne z UEC
- Skrócony czas realizacji zadania
- Wyjątkowa dostępność

Architektura rozwiązań Pensando Networking jest ściśle powiązana z istniejącymi architekturami centrów danych AMD, w szczególności z rodzinami EPYC i Instinct, które wykorzystują przełączniki PCIe w celu efektywnego łączenia kart sieciowych i procesorów.

Co ważne, karta sieciowa Pensando działa bez przełącznika PCIe i łączy się bezpośrednio z gniazdem Gen5 x16. Podstawową architekturę przedstawiono na poniższym schemacie:

Dzięki wykorzystaniu architektury P4 karta sieciowa Pensando Pollara 400 AI osiąga niezwykłą wydajność.

Do najważniejszych komponentów architektury należy silnik tabel (TE), który odpowiada za generowanie kluczy tabel z wektora nagłówka pakietu, a także za wykonywanie określonych operacji odczytu pamięci na podstawie typu danych.

Projekt obejmuje również Match Processing Unit (MPU), specjalistyczny procesor wykorzystujący zoptymalizowane kody operacji do manipulacji polami, umożliwiający obsługę odrębnych interfejsów pamięci, tabeli i PHV.

Ponadto innowacje takie jak funkcja translacji adresu wirtualnego na adres fizyczny (va2pa) jeszcze bardziej zwiększają wydajność systemu.

Jeśli chodzi o operacje pamięci atomowej, AMD wdrożyło je obok systemów SRAM w celu uzyskania większej wydajności.

Spójność pamięci podręcznej potoku wykorzystuje logikę unieważniania/aktualizowania, zapewniając efektywne działanie spójności P4 na podstawie zakresu adresów.

AMD identyfikuje kilka wyzwań wpływających na wydajność systemów AI w sieciach skalowalnych. Problemy takie jak nieefektywne wykorzystanie łączy związane z równoważeniem obciążenia ECMP, przeciążenie sieci i utrata pakietów obniżają ogólną efektywność.

Firma podkreśla również, że sieci AI charakteryzują się znacznie wyższymi wskaźnikami wykorzystania w porównaniu z sieciami ogólnego przeznaczenia, co często przekracza granice dostępnej przepustowości sieci.

AMD przedstawia Ultra Ethernet Consortium (UEC) jako kluczowe rozwiązanie pozwalające pokonać te przeszkody. UEC promuje otwarte, interoperacyjne i wydajne środowisko, zaprojektowane z myślą o spełnieniu wymagań sieciowych niezbędnych dla aplikacji AI i obliczeń o wysokiej wydajności (HPC) na dużą skalę.

Sieć UEC została zaprojektowana z myślą o wydajności i przystępności cenowej. Ma ona sprostać wysokim wymaganiom, jakie coraz częściej stawia się nowoczesnym sieciom danych.

Dodatkowe zalety UEC obejmują udoskonalone techniki routingu i rozwiązania do zarządzania siecią, zaprojektowane z myślą o rozwiązywaniu problemów związanych z przeciążeniem i utratą pakietów.

Podsumowując, karta sieciowa RDMA Pensando Pollara 400 AI UEC-ready firmy AMD zapewnia o 25% lepszą wydajność w porównaniu z RoCEv2 z 4 parami Q, a także zauważalny wzrost o 40% w porównaniu z RoCEv2 z 1 parą Q, co umacnia jej pozycję lidera w dziedzinie technologii sieciowych.
Dodaj komentarz