大型計算機システムの省エネルギー

大型計算機システムの省エネルギー

 京都大学に科学技術計算や情報処理による学術研究支援のため設置されている大型計算機(スーパーコンピューター)、その運用や維持にも省エネルギーの取り組みが行われています。

HPCの効率的運転とスケジューラ開発

京都大学 情報環境部

京都大学学術情報メディアセンターのスーパーコンピュータ(PRIMEPOWER HPC2500)の消費電力を削減するための取り組みとその中で開発したスケジューラについて紹介する。

背景

計算機の性能向上と消費電力の増加

HPC2500は12ノードで構成するSMPクラスタ ノード単位で制御可能

PRIMEPOWER HPC2500

スケジューラ

待ちジョブに応じて運転するスケジューラを開発
[空きノードを作るジョブスケジューリング]

機能要件

  • HPC2500(ジョブやノード)の状態監視
    • 実行待ちジョブ、ノードの空き資源
    • ユーザ毎の利用状況
  • ジョブの割り付け
    • 実行するジョブの決定 (優先順位付け)
    • ジョブを実行可能なノードの探索(空き資源が少ないノードを優先して使う)
  • ノードの起動/停止
    • 空きノードを停止

クラス クラスの責務
監視 ジョブやノードなどのデータを更新する
コントローラ ジョブ割り付け又はノード制御に処理を委譲する
ジョブ割付 ジョブの割り付けを行う
ノード制御 ノードの起動/停止を行う
スーパーコンピュータ データアクセスのインターフェイス
ジョブ ジョブ情報を持つデータ
キュー ジョブキューの情報を持つデータ
ノード ノードの情報をもつデータ
ユーザ ユーザの情報を持つデータ

HPC2500 稼働状況

空調機の更新

  • H18.3に3台更新(10年以上前の古い空調)
  • 消費電力が半分 39kWh →19kWh
  • COPは倍以上に 1.34 → 2.96

まとめ

スーパーコンピュータの運転経費は膨大 1割の削減で数百万円の節約
開発したスケジューラで効率的に運転
空調機の更新による電力削減