Microsoft Azure z mocą obliczeniową 16.59 petaflops wszedł niedawno do pierwszej dziesiątki w rankingu superkomputerów TOP500. Teraz gigant publikuje nowe wyniki — tym razem w kontekście AI. Są to wyniki benchmarka MLPerf 1.1, w którym Azure znalazł się na 2 miejscu pod względem wydajności i na 1 miejscu wśród dostawców chmur.
Już w 2016 roku Microsoft zaczął prezentować Azure jako pierwszy superkomputer AI, a cztery lata później — jako piąty najpotężniejszy superkomputer na świecie. Chmura wyciąga coraz więcej, zwłaszcza przy użyciu nowej serii maszyn wirtualnych NDm A100 v4 napędzanych przez NVIDIA A100 Tensor Core GPUs z 80GB pamięci HBM2e i wysoce wydajną obsługą sieci NVIDIA Quantum InfiniBand. Wyniki pokazują zaangażowanie Azure w podnoszenie poprzeczki pod względem skali i wydajności trenowania AI przy użyciu chmury obliczeniowej — skomentował Microsoft. Dokładne wyniki benchmarka przedstawiają się następująco:
- Około 25 sekund na wytrenowanie modelu przetwarzania języka naturalnego BERT Large na 2048 GPUs.
- Przetwarzane do 3,8 mln obrazów na sekundę przy użyciu klasyfikacji obrazów Resnet50 1.5 z 2048 GPUs.
- Ukończony benchmark Minigo (reinforcement learning) w czasie poniżej 17,5 minuty dzięki 1792 GPUs.
MLPerf to konsorcjum liderów AI ze środowisk akademickich, laboratoriów badawczych i przemysłu, których misją jest budowanie uczciwych i użytecznych benchmarków, które dają obiektywne oceny wydajności trenowania modeli AI oraz wnioskowania sprzętu, oprogramowania i usług. MLPerf przeprowadza testy w regularnych odstępach czasu i dodaje nowe obciążenia, które odzwierciedlają aktualny stan wiedzy w dziedzinie sztucznej inteligencji.