Uniwersystet Tsukuba tworzy Pegasusa, Superkomputer AI z ogromną pamięcią zbudowany na platformie Supermicro SuperBlade

| Nowości Supermicro

Uniwersystet Tsukuba tworzy Pegasusa, Superkomputer AI z ogromną pamięcią zbudowany na platformie Supermicro SuperBlade

Centrum Nauk Obliczeniowych Uniwersytetu Tsukuba tworzy system HPC o ogromnej pamięci dla naukowców z różnych dziedzin.

Wstęp

Centrum Nauk Obliczeniowych na Uniwersytecie Tsukuba to multidyscyplinarne centrum, które współpracuje z wieloma organizacjami w zakresie badań podstawowych w kilku obszarach. W ramach trwającego projektu dostarczania najnowocześniejszych możliwości obliczeniowych szerokiemu gronu badaczy, Uniwersytet Tsukuba, wraz z NEC (jako głównym wykonawcą), stworzył superkomputer, który zaspokoi potrzeby w zakresie przetwarzania i przechowywania danych przy użyciu Supermicro SuperBlade. System jako jeden z pierwszych na świecie wykorzystuje procesory graficzne NVIDIA H100 i skalowalne procesory Intel® Xeon® czwartej generacji.

Wyzwania

Centrum Nauk Obliczeniowych na Uniwersytecie Tsukuba ustaliło, że potrzebny jest nowy system HPC, aby sprostać rosnącym potrzebom naukowców. W miarę wykorzystywania i opracowywania nowych aplikacji do badań nad sztuczną inteligencją, nauki o danych i nauk obliczeniowych potrzebny jest system ze znaczną ilością pamięci na proces, aby sprostać tym inicjatywom. Aktualny trend jest taki, że liczba rdzeni na procesor wciąż rośnie, a ilość pamięci RAM na rdzeń nadal maleje. Uniwersytet Tsukuba potrzebował rozwiązania, które spełniałoby szereg wymagań:

  • szybkie przetwarzanie procesora,
  • szeroki dostęp do pamięci,
  • najnowsze GPU do przetwarzania.

Rozwiązanie

Centrum Nauk Obliczeniowych na Uniwersytecie Tsukuba wybrało rozwiązanie SuperBlade® od Supermicro do stworzenia swojego nowego superkomputera, który zaspokaja duże zapotrzebowanie na pamięć dzięki najnowszym technologiom GPU do zastosowań HPC i AI.

W szczególności Uniwersytet Tsukuba nabył 120 bladów Supermicro 6U SuperBlade (w 24 obudowach, po 5 bladów SuperBlade na obudowę). Każdy serwer kasetowy SuperBlade (SBI-611E-5T2N) jest wyposażony w procesory Intel® Xeon® Platinum 8468 czwartej generacji (350 W TDP) i zawiera pojedynczy procesor graficzny NVIDIA® H100 Tensor Core 80 GB HBM2E i 128 GB pamięci DDR5-4800 MHz na moduł. Ponadto każdy węzeł zawiera pamięć trwałą Intel® OptaneTM z serii 300. Sieć dla każdej kasety wspierana jest przez najnowszy NVIDIA® ConnectX®-7 HCA do połączenia z najnowszym przełącznikiem NVIDIA Quantum-2 InfiniBand NDR 400 Gb/s.

Poniżej znajduje się obraz SuperBlade używanego w nowym Superkomputerze Pegasus Uniwersytetu Tsukuba.

Cechy kluczowe:

Supermicro SuperBlade obudowa

  • SBE-610J2-822 Enclosure
    • 5 Blades per obudowa
    • Switch Ethernet
    • 95% sprawność zasilania redundantnego Titanium

Blade

  • SBI-611E-5T2N
    • Procesor Intel Xeon Scalable 4th Gen
    • 128GB DDR5 pamięć RAM
    • Intel Optane 2048GB pamięci trwałej
    • NVidia H100 80GB PCIe GPU
    • NVidia ConnectX-7 InifiBand NDR HCA

120-węzłowy superkomputer Pegasus na Uniwersytecie Tsukuba ma teoretyczną szczytową wydajność 6,51 petaflopsa przy podwójnej precyzji, przy zmierzonej wydajności LINPACK na poziomie 3,48 petaflopsa. Ogólny klaster zajmuje 190. miejsce na najnowszej (czerwiec 2023 r.) liście Top500 najszybszych superkomputerów na świecie. Aby dowiedzieć się więcej o wydajności całego systemu, odwiedź stronę https://www.top500.org/system/180170/ . Ponadto Pegasus zajmuje 12. miejsce na liście Green500, wykazując niesamowitą wydajność 40,448 GFlops/W jako jeden z najbardziej energooszczędnych zielonych superkomputerów na świecie.

Całkowita pamięć w klastrze Pegasus ma ogromne 255 TB (terabajtów) (15 TB DDR5 + 240 TB pamięci trwałej), z systemem plików 7,1 PB z przepustowością I/O 40 GB/s.

Oprócz komponentów sprzętowych wdrażany jest rozbudowany ekosystem oprogramowania
na serwerach, składający się z:

  • Ubuntu
  • Intel oneAPI (C++/C/Fortran, oneMKL, MPI, VTune, Trace Analyzer&Collector)
  • NVidia HPC SDK (C++/C/Fortran/Cuda, cuBLAS, cuTENSOR, cuFFT, Open MPI, NVSHMEM, NCCL, profilery, debuger)
  • Open Source SDK (kompilatory GNU, Python, PMDK, Open MPI)
  • Tensorflow, Keras, PyTorch
  • JypyterHub, TensorBoard, Nextcloud, Gfarm

Korzyści

Uniwersytet Tsukuba odnotował znaczną poprawę wydajności aplikacji dzięki czterem głównym czynnikom:

  1. Wyższa wydajność dzięki procesorom Intel Xeon Scalable czwartej generacji
  2. Wykorzystanie procesora graficznego NVIDIA H100 Tensor Core 80 GB PCIe
  3. Dodatkowa ogromna przestrzeń pamięci dzięki Intel Optane Persistent Memory 300
  4. Znaczące oszczędności energii jako jeden z najbardziej energooszczędnych superkomputerów na świecie (40,448 GFlops/Watt)

„Supermicro SuperBlade zawarty w rozwiązaniach NEC dostarczył niesamowity zestaw produktów HPC, realizujących wyższą gęstość w zaledwie pięciu szafach i zintegrowanych z najwyższą wydajnością i najnowszą generacją procesorów, pamięci trwałej, procesora graficznego i technologii sieciowych. Dzięki ogromnemu superkomputerowi z pamięcią, nasz uniwersytet będzie w stanie zintensyfikować nasze badania w obszarach takich jak analiza danych na dużą skalę, nowe zastosowania sztucznej inteligencji big data i badania oprogramowania systemowego.Ten system HPC o dużej gęstości integruje kombinację procesorów Intel Xeon Scalable czwartej generacji, NVIDIA H100 Tensor Procesor graficzny Core 80 GB PCIe i szybka sieć InfiniBand NDR, wszystko w Supermicro SuperBlade dało nam fantastyczny system HPC, którego będziemy używać przez lata.”

Prof. Taisuke Boku, dyrektor Centrum Nauk Obliczeniowych (Center for Computational Sciences) na Uniwersytecie Tsukuba.

Dowiedz się więcej o CCS na: https://www.ccs.tsukuba.ac.jp/eng/

Podsumowanie

Supermicro - Supermicro jest światowym liderem w dziedzinie wysokowydajnych, ekologicznych technologii serwerowych i innowacji. Dostarczamy naszym klientom na całym świecie zoptymalizowane pod kątem aplikacji serwery i stacje robocze dostosowane do rozwiązań kasetowych, pamięci masowej i procesorów graficznych. Nasze produkty oferują sprawdzoną niezawodność, doskonałą konstrukcję i jedną z najszerszych w branży konfiguracji produktów, aby zaspokoić wszystkie potrzeby obliczeniowe. Aby uzyskać więcej informacji, odwiedź www.supermicro.com

NEC - NEC ugruntował swoją pozycję lidera w integracji IT i sieci technologii, jednocześnie promując hasło marki „Orchestrating a brighter world”. NEC umożliwia firmom i społecznościom dostosowanie się do szybkich zmian zachodzących zarówno w społeczeństwie, jak i na rynku, ponieważ zapewnia społeczne wartości bezpieczeństwa, ochrony, sprawiedliwości i wydajności w celu promowania bardziej zrównoważonego świata, w którym każdy ma szansę w pełni wykorzystać swój potencjał.
Więcej informacji można znaleźć na stronie www.nec.com

Powiązane strony:

  1. Rozwiązania Supermicro dedykowane AI
  2. Artificial Intelligence (AI) ChatGPT, Bing, Bard - part 1
  3. NVidia L40S oraz lista kompatybilnych serwerów Supermicro