河野議員の「スパコン京への疑問」への自分なりの回答

河野太郎議員が「スパコン京への疑問」という記事を書かれたので、元一科学計算経験者として分かる範囲で回答いたします。


スパコン京の利用については、選定機関が認めたものに限るようだが、既に科研費の審査を通ったものについて、再度、スパコンを利用するための申請書を書き、それを審査するのは無駄ではないか。負担金額に応じたリソースが使えるようなルールにすべきではないか。(科学振興予算の純粋科学と技術開発の割り振りを適正化する必要がある)

再審査はできるだけ省いてもらった方がありがたいが、「負担金額に応じたリソースが使えるようなルール」というのは意味が分からない。既に持ってる研究費に応じてではなく、そのスパコンを使う科学的意義の高さと必然性に応じてリソースを配分するルール作りの方が適切。

成果目標の明確化を求めると、純粋な研究の可能性を狭めないか。

「純粋な研究」とはどういう意味か?どんな基礎研究でも一定の科学的な(そして間接的・長期的に経済・社会的な恩恵を生む)成果目標を求められるのは当然。その成果目標が経済的利益でなくてはならないというのならば問題。

来年6月の引き渡しから半年近く経った11月からしか供用されないのはなぜか。
京を中核とするネットワークで接続されたHPCIとこれまでのネットワークに接続されているスパコンの環境はどこがちがうのか。

これについては詳しく知らないので割愛。

「次世代スパコンと全国の主要スパコンをネットワークで結ぶことにより、研究の内容、性質に応じて最適なスパコンを選んで計算することが可能になる」というが、計算機を使い分けることが実際にあるのか。

これが実現するなら非常に便利。共通のスケジューラーに、どのようなリソース配分をすれば既にキューに入れられている計算リクエストを一番効率良く処理できるのかを判断させられるので、計算資源の有効活用化に繋がる。

ソフトウェアのデバッグを考えると、京一台というのは効率が悪くないか。

デバッグ用のテスト環境を用意すればいいことなので無問題。
また「京」は864のマシン(ノード)が集まってるものなので、「京一台」という認識は誤認。

東大の次世代スパコンは、富士通の1ペタ以上のものになるが、これまでの日立のスパコンからのソフトウェアの移行という作業が加わることをどう考えるか。
また、京大の次世代はCLAYになるが、同じような問題が発生するのだろうか。

質問の意味がよく分からないので割愛。

民間で京クラスのスパコンを必要とするところがあるか。ソフトウェアをかける研究者がいるのか。これまでのスパコンの民間の利用はどうだったのか。

需要としては余裕で使い切れる。自動車・航空機等々に必要な流体計算はもちろんの事、より巨大・精密な計算をしたい製薬業界でも需要はあるはず。研究者レベルならソフトウェアを書けるようになるのはそれ程時間はかからない。言語はFortran/C/C++が使えるし、並列ライブラリもMPI準拠の物やOpenMPと標準的な物。OSはLinuxベース。(この資料の21p参照。)完全に性能を出し切るためのプログラムが書けるまでは数ヶ月〜1年くらいはかかるかもしれないが、まずはこういう環境が生まれないと開発者側の成長も始まらない。

本当に「スパコンを利用した研究が飛躍的に進展し、推定利用者が1000人から2万人になる」か。

これは「スパコン」の定義によります。今でも十数年前のスパコン並みの計算リソースを使って科学計算してる人は相当数いるはず。したがって質問の意義がよく分からない。

開発加速の経費110億円が削減されたのにほぼ当初のスケジュールできているのはなぜか。企業努力なのか。
NECや日立に支払われた開発経費はどうするのか。
メンテナンス経費は適正か。
ストレージの単価の低減が急激に起こることを考えると、ストレージの導入計画は適正か。

詳細を知らないので割愛。

スパコンの利用率は導入年度には低く、後年度に高くなることを考えると、性能はレベルアップ方式で調達すべきではないのか。

「レベルアップ方式」の意味が分からない。少しずつ後から性能のよいマシンを足していくということだろうか?
こういう並列性の高さを追求するスパコンでは一つ一つのノードの均一性も重要になってくるので、もらった予算はその時のベストのマシンを買うのに使いきる方がコスト的にみてもベターな可能性も大きい。5年など待ってたら今の最先端のスパコンでもどのみち時代遅れになって意味が無くなる。

10ペタという開発目標は適正だったのか。

それまでのトップが1-2ペタフロップス前後だという事を考えると、技術的な革新が必要なハードルとしては適切な目標だったと思う。0.1ペタフロップスの差を競うような一位では全く意味が無いが、5倍以上の性能差を単なるマシン数の差でつけるのではなく、技術力でつけられるのであれば一位になる意味がある。速ければ速い方がいいのは言うまでもないが、それは予算と期間の兼ね合い。

10ペタフロップスの性能に対して、1ペタバイトのメモリーは適正か。

55万CPUコアあるので、それで1PBなら1CPUコアあたり2GB弱。豊富な方だが大きすぎることはない。

文科省は、かつてLinpackで一位になった中国のスパコン「天河」に関して、「多くのアプリケーションで必要とされる主記憶との間のデータ転送性能が十分とは言えず、応用範囲は限定的。性能を引き出すためには専用の言語でのプログラミングが必要となるため、ソフトウェア試算の継承や流通が難しい」と指摘したが、なぜ、京では10ペタフロップスだけが強調されるのか。

「天河」はGPUベースなので汎用性は少ないが、「京」は汎用的なCPUの「SPARC64 VIIIfx」を使用しているのでこの指摘は的外れ。

スカラー型とベクター型の混合型が適正とした当初の計画から、スカラー型のみの計画に転換したのはなぜか。

詳細は分からない、予算と実際の状況の変化を鑑みて現実的な折り合いを付けたのでは?

文科省は、自民党事業仕分け民主党政権事業仕分けで指摘されたことに対して、きっちりと答えていないではないか。

割愛。

一部の学者のためのスパコンになっていないか。
なぜ、スパコン京の利用を一部の機関、一部のプログラムに優先的に割り当てる必要があるのか。

これは適切な疑問だが、最先端のスパコンのメリットを最大限に活かすためには利用するプロジェクトを限定する必要があるので、限定すること自体は適切。その選定基準は明確にすべき。他のシード的な科学計算のために量的コストパフォーマンスに優れた別の計算リソースを用意していき、それとの両輪で進めていくべき。

今後のスパコン開発は何を目標とするのか。なんのためのスパコン開発をするのか。

重要な質問。
しかし、今ほどの技術のレベル差を保てるのであれば、最先端は安全保障や国内産業限定に使用し、型落ちを他国に輸出して研究開発費を回収するという現在の米国の軍需産業のような立場を得られるのではないか?そのようなビジョンを政策レベルで実現していただきたい。型落ちモデルのレベルがどんどん上がれば、より多くの研究者に計算リソースが行き渡り様々な用途が生まれてくる。

またもうこれ以上の計算性能はいらないのではという疑問も当然生まれるだろうが、今科学者が本当に計算したい事には現在の計算力は全く追いついていない。(本音としては、後1万倍ほどあっても足りないくらい。)計算科学を用いる研究は、数週間単位の計算を何度も繰り返して、その都度結果を解析・検証しながら次の計算の方向性を考えていくプロセスを経て進んでいく。したがって10倍近くの性能差があれば、できる計算のステージの高さ自体に差が出てくる。したがって、計算科学の世界においてこれで性能は十分だということはしばらくの間ありえない。


以上で、回答終わります。