Archive

派遣研究者REPORT

“流れ”を大型計算機で
読み解く数値流体力学(CFD)。
次世代スパコンによる
次世代CFDの可能性を探る。

シュトゥットガルト大学 高性能計算センター
(ドイツ シュトゥットガルト)
2010年10月5日~2010年12月16日(73日間)

最適化手法の研鑽と課題の明確化。次世代CFDに向けた大きな成果。

この取材に前後して、東北新幹線の新型車両E5系「はやぶさ」のニュースが大きく報じられました。2年後には最高時速320キロでの営業運転をめざす“ロングノーズ”の車両デザインは、流体力学的な必然性を持っています。ロケットや航空機、新幹線をはじめとした鉄道車両、自動車、大型船舶など流体(液体と気体)を移動する機械の設計を行うにあたり、近年重要な手法となっているのが数値流体力学(Computational Fluid Dynamics:以下CFD)です。流体の運動に関する方程式を大型計算機で解くことによって、流れ場を観察するCFDは、コンピュータの性能向上とともに飛躍的に発展してきました。「現在、東北大学では『ペタフロップス※1級計算機に向けた次世代CFDの研究開発※2』に取り組んでいます。私が担うのは、様々なスーパーコンピュータを用いて、この次世代CFDのための計算アルゴリズムを探り、要素技術・最適化技術の研究開発を推進させることです」と小松さん。今回の派遣先はヨーロッパでも有数の大型計算機センターとして知られるドイツのシュトゥットガルト大学・高性能計算センター(High Performance Computing Center Stuttgart:以下HLRS)(写真/図1)。「HLRSとはこれまでも年2回ペースで研究会を共催するなど、共同研究が盛んに行われてきました。2009年4月には本センターと研究協定が締結されています」。小松さんはグラフィックスプロセッサ(Graphics Processing Unit:以下GPU)を搭載したスーパーコンピュータを用いて、次世代CFDの実装・最適化・評価に取り組みます。その研究内容を簡単にご説明いただきましょう。

「ペタフロップス級計算機に向けた次世代CFDとして、BCM(Building Cube Method)が提案されています。大規模並列処理を念頭に設計されているBCMは、計算領域をCube と呼ばれる立方体領域で、さらにCube 内はCell と呼ばれる等間隔直交格子で分割・構成されています。3つの並列化階層※3を持つGPU クラスタシステムの高い性能を引き出し、BCM の高速化を実現するためには、処理を適切に割り当てる必要があります。今回の実装ではCell の並列性を抽出するアルゴリズムを採用しました」。その性能評価では、スケーラビリティ※4に関する課題が見いだされました。「その要因としてCube内の全データを交換しているため、余計なデータコピーやデータ転送が発生し、さらにはCubeがランダムに各ノードに割り当てられているため、余分なノード間のデータ転送が必要になってしまったことが考えられました。また解析結果の可視化については、HLRSの研究グループが開発しているソフトウェアを基に、BCMの計算結果を表示できるようなソフトウェア開発に取り組みました。その結果、複数の物理量のインタラクティブな可視化や三次元立体視が可能となり(写真/図2)、BCMにおける可視化の検討に弾みがつく形となりました」。

小松さんのHLRSでの取り組みは、大規模計算システムにおけるプログラミング技術と最適化手法の習得、研究課題の明確化という大きな成果をあげました。

※1
コンピュータの処理速度をあらわす単位のひとつ。フロップス(FLOPS)は「Floating point number Operations Per Second」の略で1秒間に1回の計算ができる処理速度をあらわし、ペタは1000兆(10の15乗)を意味する接頭辞。1秒間に1000兆回の浮動小数点数演算(実数計算)を実行できることを意味する。
※2
科研費基盤研究(S)、航空宇宙工学分野、研究代表者 中橋和博教授
※3
①ノードレベル並列性、②GPU 内におけるSM (Stream Multi-processor)レベル並列性、③SM 内におけるSP(Stream Processor)レベル並列性
※4
コンピュータシステムの持つ拡張性。システムの負荷の増大などに応じて、柔軟に性能や機能を向上させられることを意味する。

(写真/図1)1829年創立のシュトゥットガルト大学は現在14学部、約21,000人の学生を擁する工科大学。HLRSは同大に併設された国立計算センターである。写真はHLRS新棟。

(写真/図2)BCMによる計算のマルチ物質量の同時可視化。