Hardware

Fabryka AI w Wisconsin rzuca wyzwanie fizyce: Microsoft spina setki tysięcy GPU Blackwell w potworną maszynerię

Koniec z serwerowniami, czas na fabryki

Satya Nadella ogłosił koniec ery tradycyjnych centrów danych. Start projektu Fairwater w Wisconsin to moment, w którym Microsoft przestaje oferować jedynie moc obliczeniową, a zaczyna budować monolit. To nie jest zwykła hala wypełniona szafami rackowymi; to system operacyjny na poziomie infrastruktury.

Fairwater ruszył przed harmonogramem, co w branży zdominowanej przez opóźnienia w łańcuchach dostaw jest jasnym sygnałem: wyścig zbrojeń przeniósł się z poziomu kodu na poziom fizycznych instalacji wysokoprądowych.

Architektura ekstremalna

Sercem instalacji jest platforma NVIDIA GB200. Zapomnij o klasycznym rozumieniu serwera – tutaj szafy sterownicze mieszczą po 72 układy Blackwell połączone w domenie NVLink o przepustowościach, które czynią z całego klastra jedną, gigantyczną kartę graficzną.

  • Zastosowanie dwupiętrowego układu serwerowni dla optymalizacji okablowania.
  • Zamknięty obieg chłodzenia cieczą eliminujący ryzyko przegrzania przy skokowym poborze mocy.
  • Integracja procesorów NVIDIA Grace z GPU Blackwell w architekturze ND GB200 v6.
  • Bezpośrednie spięcie dziesiątek tysięcy jednostek w jeden bezproblemowy klaster.

Pojedyncza maszyna wirtualna w tej architekturze wykorzystuje dwa procesory Grace i cztery GPU Blackwell, co czyni ją potworem do inferencji najbardziej wymagających modeli językowych.

Strategia szklanego sufitu

Microsoft gra inaczej niż konkurencja. Podczas gdy Google Cloud stawia na elastyczne maszyny A4, a Amazon i Oracle promują dostępność chmurową, Microsoft buduje architekturę totalną.

To brutalna demonstracja siły kapitałowej.

Inwestycja w Fairwater pokazuje, że bariera wejścia do elity AI przestała być mierzona algorytmami. Dziś wejściówka do gry kosztuje miliardy dolarów wydane na autorskie systemy chłodzenia (które w przypadku szaf rackowych GB300 NVL72 mogą kosztować 50 tys. dolarów za sztukę) oraz zabezpieczenie dostaw energii, o których mniejsze firmy mogą tylko pomarzyć.

Kontekst i ryzyko

Mimo optymizmu Nadelli, skala Fairwater budzi pytania o odporność. Niedawna katastrofa w chmurze rządowej Korei Południowej (NIRS Daegu) pokazała, że centralizacja w jednym punkcie to proszenie się o kłopoty. Jednak dla Microsoftu redundancja to koszt, na który ich stać, a przewaga czasowa w dostarczaniu modeli Copilot i OpenAI do klientów końcowych jest warta niemal każdego ryzyka pożarowego czy środowiskowego.

Infrastruktura to nowe oprogramowanie. Kto kontroluje szafy rackowe, ten kontroluje tempo rozwoju AI.