Huawei przeciera szlaki: nowa architektura SuperPoD może zmienić infrastrukturę AI
Huawei, podczas konferencji HUAWEI CONNECT 2025, zademonstrował przełomową architekturę infrastruktury AI – SuperPoD. To rozwiązanie ma potencjał zrewolucjonizowania sposobu, w jaki budowane i skalowane są systemy sztucznej inteligencji na całym świecie. Zamiast tradycyjnego podejścia, gdzie poszczególne serwery działają w dużej mierze niezależnie, SuperPoD tworzy coś, co przedstawiciele Huawei opisują jako pojedynczą, logiczną maszynę złożoną z tysięcy jednostek obliczeniowych, co pozwala im – lub jej – „uczyć się, myśleć i rozumować jako całość”. Implikacje tej technologii wykraczają poza imponujące specyfikacje techniczne i stanowią przesunięcie w sposobie organizowania, skalowania i wdrażania mocy obliczeniowej AI w różnych branżach.
Klucz do sukcesu: UnifiedBus 2.0
Sercem nowego podejścia Huawei jest UnifiedBus (UB). Yang Chaobin, dyrektor zarządu i CEO ICT Business Group w Huawei, wyjaśnił, że „Huawei opracował przełomową architekturę SuperPoD w oparciu o nasz protokół połączeń UnifiedBus. Architektura ta głęboko łączy fizyczne serwery, dzięki czemu mogą one uczyć się, myśleć i rozumować jak jeden logiczny serwer”. UnifiedBus 2.0, według Huawei, niweluje ograniczenia związane z komunikacją na dużą skalę, takie jak niezawodność połączeń na dużych odległościach i przepustowość-opóźnienie. Tradycyjne połączenia miedziane, choć oferują wysoką przepustowość, działają efektywnie tylko na krótkich dystansach. Z kolei kable optyczne, mimo większego zasięgu, cierpią na problemy z niezawodnością, które nasilają się wraz z odległością i skalą.
Eric Xu, wiceprezes i rotacyjny przewodniczący Huawei, podkreślił, że rozwiązanie problemów z łącznością było kluczowe dla strategii firmy w zakresie infrastruktury AI. Huawei zbudował niezawodność w każdej warstwie protokołu połączeń, zapewniając detekcję błędów na poziomie 100 nanosekund i przełączanie ochronne na ścieżkach optycznych, co sprawia, że sporadyczne rozłączenia lub awarie modułów optycznych są niezauważalne na poziomie aplikacji.
Architektura SuperPoD: skala i wydajność
Atlas 950 SuperPoD, flagowe wdrożenie tej architektury, obejmuje do 8192 chipów Ascend 950DT w konfiguracji, która, jak twierdzi Xu, zapewnia „8 EFLOPS w FP8 i 16 EFLOPS w FP4. Jego przepustowość połączeń wyniesie 16 PB/s. Oznacza to, że pojedynczy Atlas 950 SuperPoD będzie miał przepustowość połączeń ponad 10 razy większą niż całkowita szczytowa przepustowość Internetu na całym świecie”. Atlas 950 SuperPoD zajmuje 160 szaf na powierzchni 1000 m2, ze 128 szafami obliczeniowymi i 32 szafami komunikacyjnymi połączonymi w pełni optycznymi połączeniami. Pojemność pamięci systemu sięga 1152 TB i utrzymuje opóźnienie na poziomie 2,1 mikrosekundy w całym systemie.
W późniejszym etapie produkcji pojawi się Atlas 960 SuperPoD, który ma zawierać 15 488 chipów Ascend 960 w 220 szafach zajmujących powierzchnię 2200 m2. Xu zapowiedział, że zapewni on „30 EFLOPS w FP8 i 60 EFLOPS w FP4, a także 4460 TB pamięci i 34 PB/s przepustowości połączeń”.
Więcej niż AI: uniwersalne zastosowania obliczeniowe
Koncepcja SuperPoD wykracza poza obciążenia AI i obejmuje obliczenia ogólnego przeznaczenia dzięki TaiShan 950 SuperPoD. Zbudowany na procesorach Kunpeng 950 system ten rozwiązuje wyzwania przedsiębiorstw związane z wymianą starszych komputerów mainframe i średniej klasy. Xu uważa to za szczególnie istotne dla sektora finansowego, gdzie „TaiShan 950 SuperPoD, w połączeniu z rozproszoną bazą danych GaussDB, może służyć jako idealna alternatywa i zastąpić – raz na zawsze – komputery mainframe, komputery średniej klasy i serwery baz danych Oracle Exadata”.
Otwarta strategia architektury
Kluczowe dla całego rynku infrastruktury AI, Huawei ogłosił udostępnienie specyfikacji technicznych UnifiedBus 2.0 jako otwartych standardów. Decyzja ta odzwierciedla zarówno strategiczne pozycjonowanie, jak i praktyczne ograniczenia. Xu przyznał, że „Chiny kontynentalne będą przez stosunkowo długi czas opóźnione w zakresie węzłów procesów produkcyjnych półprzewodników” i podkreślił, że „zrównoważoną moc obliczeniową można osiągnąć tylko dzięki praktycznie dostępnym węzłom procesów”.
Huawei planuje udostępnić komponenty sprzętowe i programowe na zasadach open-source, w tym moduły NPU, serwery kasetowe chłodzone powietrzem i cieczą, karty AI, płyty CPU i karty kaskadowe. W zakresie oprogramowania firma zobowiązała się do pełnego udostępnienia narzędzi kompilatora CANN, zestawów aplikacji Mind series i modeli podstawowych openPangu do 31 grudnia 2025 r.
Wpływ na ekosystem i wdrożenia rynkowe
Wdrożenia stanowią walidację dla technologii Huawei. Ponad 300 jednostek Atlas 900 A3 SuperPoD zostało już wysłanych w 2025 roku i wdrożonych u ponad 20 klientów z różnych sektorów, w tym z Internetu, finansów, telekomunikacji, energetyki i produkcji. Implikacje dla rozwoju chińskiej infrastruktury AI są ogromne. Tworząc otwarty ekosystem wokół krajowej technologii, Huawei stara się rozwiązać problem budowy konkurencyjnej infrastruktury AI wewnątrz parametrów wyznaczonych przez ograniczenia produkcyjne i dostępność półprzewodników. Takie podejście umożliwia szerszy udział branży w rozwoju rozwiązań infrastruktury AI bez konieczności dostępu do najbardziej zaawansowanych węzłów procesów.
Dla globalnego rynku infrastruktury AI otwarta strategia architektury Huawei wprowadza alternatywę dla ściśle zintegrowanego, zastrzeżonego podejścia sprzętowo-programowego dominującego wśród zachodnich konkurentów. To, czy ekosystem proponowany przez Huawei może osiągnąć porównywalną wydajność i utrzymać rentowność komercyjną, pokaże dopiero czas. Architektura SuperPoD to coś więcej niż tylko ewolucja w obliczeniach AI. Huawei proponuje fundamenty sposobu, w jaki ogromne zasoby obliczeniowe są połączone, zarządzane i skalowane. Otwarcie specyfikacji i elementów ma na celu sprawdzenie, czy wspólny rozwój może przyspieszyć innowacje w infrastrukturze AI w ekosystemie partnerów. To z kolei potencjalnie wpłynie na dynamikę konkurencyjną na globalnym rynku infrastruktury AI.
