Overview

深層学習による問題解決能力を支える計算基盤

深層学習をはじめとするPreferred Networks(PFN)の中核技術は膨大な計算を要求します。

PFNでは、多量の計算を効率的に実行するために独自の計算機クラスターを複数運用しています。 これらの計算機クラスターはシリーズ毎にナンバリングされており、現在はMN-2、MN-3が稼働しています。

PFNにおける計算基盤の研究開発

PFNのビジネスや研究開発は膨大な計算能力に支えられており、常に多くの計算需要が存在しています。性能や効率が良い計算基盤を実現するための研究開発はPFNにとって欠かすことができないものです。

GPUやMN-Coreなどの演算アクセラレータを搭載したサーバー群とネットワークやストレージなどの周辺要素を組み合わせてPFNが必要とするワークロードに最適化されたシステム設計をおこない、常に最先端の計算基盤が社内外の研究者や開発者に提供できるようになっています。

独自ASICであるMN-Coreシリーズの開発、MN-Coreシリーズを使いこなすノード構成技術、機械学習などに最適化されたネットワークやインターコネクト技術、収容効率や電力効率の高い物理構成技術など、PFNでは高性能な計算機を実現するために多くの研究開発に取り組んでいます。

Infrastructure

MN-3

MN-3は、PFNと神戸大学が共同開発した超低消費電力の深層学習用プロセッサーMN-Core™を採用してPFNが2020年5月に構築した第3世代のクラスタです。 PFNではMN-3を用いて実用的な深層学習のワークロードの高速化を進めています。MN-3は、スーパーコンピュータの省電力性能ランキングGreen500で2020年6月2021年6月2022年11月に世界1位となり、世界で最も電力効率エネルギー性能に優れたスーパーコンピュータとして認定されました。

計測に使用したシステム構成および演算性能:

2022年5月 2021年11月 2021年6月 2020年11月 2020年6月
ノード数 32ノード 40ノード
MN-Core数 128 160
CPU (Intel Xeon)コア数 1,536 1,920
ピーク性能(各回の測定条件における理論値) 3.348 PFlops 3.390 PFlops 3.138 PFlops 3.92 PFlops
連立一次方程式を解く計算速度(HPLベンチマーク) 2.180 PFlops 2.181 PFlops 1.822 PFlops 1.653 PFlops 1.621 PFlops
省電力性能(消費電力1Wあたりの性能) 40.90 GFlops/W 39.38 GFlops/W 29.70 GFlops/W 26.04 GFlops/W 21.11 GFlops/W
Green500リストランキング 5位 1位 1位 2位 1位

2021年11月のGreen500 Certificate

Blog記事: MN-3の高精度電力計測にむけた取り組み

     TOP500とGreen500:コンピュータの性能指標をどう読むか

PFNは、MN-Coreを用いる計算機クラスターの段階的な拡充を計画しており、2020年5月に以下の構成で第一期の構築(MN-3a)が完了しています。

MN-3では、32台のMN-Core Server(計算ノード)を2台のMN-Core DirectConnect Switch で密結合した単位をひとかたまりのZoneと呼びます。

MN-3aは、1.5Zone分の計算ノードで構成されます。

Blog記事: MN-3が動き出します

MN-3aクラスターの構成は以下のとおりです。

  • MN-Core Server(計算ノード) x 48台
  • MN-Core Server間の通信ネットワーク
    • MN-Core DirectConnect (MN-Core用に専用開発したインターコネクト技術)
    • 100GbE Ethernet

MN-3aの計算ノード1台あたりの構成は以下のとおりです。

(表) MN-Core Server

MN-Core MN-Core Board x 4
CPU 2-way (Intel Xeon 8260M)
Memory DDR4 384GB
Storage Class Memory 3TB Intel Optane DC Persistent Memory
Network MN-Core DirectConnect + 100Gbps Ethernet

Blog記事: MN-3が動き出します

MN-2A

MN-2AはGPUを用いた、PFN初の自社構築・管理の計算機クラスターです。2019年7月から運用を開始しています。

MN-2Aクラスターの構成は以下のとおりです。

  • GPUサーバー(計算ノード) x 128台
  • CPUサーバー(計算ノード) x 32台
  • ストレージサーバー x 24台
  • Ethernet Switch(100GbE) x 18台

MN-2Aの計算ノード1台あたりの構成は以下のとおりです。

(表) GPUサーバー

GPU NVIDIA V100 SXM x 8
CPU Intel Xeon 6254 (2 way/36コア)
Memory DDR4 384GB
Network 400Gbps (100GbE x 4)

(表) CPUサーバー

CPU Intel Xeon 6254 (2 way/36コア)
Memory DDR4 384GB
Network 200Gbps (100GbE x 2)

Blog記事: MN-2が動き出しました

MN-2B

MN-2BはGPUを用いた計算機クラスターです。MN-2Aを拡張する形で構築されており、2022年7月から運用を開始しました。

技術的な特徴はMN-2Aに準拠していますが、最新世代のGPUおよびCPUと大きめの主記憶を搭載しており、より高い計算能力を発揮できるようになっています。PFNの計算ワークロードの分布に合わせて複数種類のGPUを組み合わせたハイブリッドクラスタとなっているのMN-2Bの特徴です。

MN-2Bクラスターの構成は以下のとおりです。

  • GPUサーバー(NVIDIA A100) x 42台
  • GPUサーバー(NVIDIA A30) x 42台

トータルのGPU数は420個になります。

MN-2Bの計算ノード1台あたりの構成は以下のとおりです。

(表) GPUサーバー (NVIDIA A100)

GPU NVIDIA A100(80GB) SXM x 4
CPU AMD EPYC 7713 (2 way/128コア)
Memory DDR4 1024GB
Network 200Gbps (100GbE x 2)

(表) GPUサーバー (NVIDIA A30)

GPU NVIDIA A30(24GB) PCIe x 6
CPU Intel Xeon 8380 (2 way/80コア)
Memory DDR4 512GB
Network 200Gbps (100GbE x 2)

運用が終了したクラスター

MN-1, MN-1b

MN-1およびMN-1bはNTT Communicationsによって構築されたPFN専用のGPU計算機クラスターで、2017年9月(MN-1)および2018年7月(MN-1b)から2022年7月まで約5年間運用されていました。

それぞれのクラスターの構成は以下のとおりです。

  • MN-1
    • GPUサーバー(NVIDIA P100 x 8, InfiniBand FDR(56Gbps)× 2) x 128台
  • MN-1b
    • GPUサーバー(NVIDIA V100 x 8, InfiniBand EDR(100Gbps)× 2) x 64台

MN-1を使った取り組み:

MN-1bを使った取り組み:

Computing Sites

  • JAMSTEC (国立研究開発法人 海洋研究開発機構) 横浜研究所 シミュレータ棟内
    • MN-2, MN-3
    • 施設の一部を借用し、独立運用

Middleware

PFNの計算機クラスターでは、OSSであるKubernetesをコア技術として採用し、独自に開発したスケジューラやフロントエンドを用いることで、機械学習・深層学習を効率よく実行するためのプラットフォームを構築しています。