クラスターのパフォーマンスを向上する

シングルノードの HPL テストでハイパフォーマンスを得るのは比較的簡単ですが、クラスターではより困難です。クラスターの HPL テストでハイパフォーマンスを得るには、次の手順に従います。ここでは、各ノードで必要なすべてのインストールが完了していると仮定しています。

すべてのノードを再起動します。
すべてのノードが同一条件で、以前の HPL 実行のプロセスが実行されていないことを確認します。

各ノードでシングルノードの Stream と HPL LINPACK またはインテル® MKL プログラム nodeperf を実行します。詳細は、「クラスターにおける結果の最適化」を参照してください。それぞれの結果の差異が 2% 以内であることを確認します (問題サイズは、メモリーサイズと CPU の動作速度に対して十分な大きさでなければなりません)。パフォーマンスの低いノードでハードウェア/ソフトウェアの問題の可能性を調査します。
クラスターのインターコネクトが動作していることを確認します。MPI テストを使用して、クラスター全体の帯域幅とレイテンシーをテストします。
2 ノードまたは 4 ノードのペアで HPL ベンチマークを実行し、それぞれの結果の差異が 4% 以内になることを確認します。問題サイズは、メモリーサイズと CPU の動作速度に対して十分な大きさでなければなりません (例えば、こちらを参照してください)。
クラスター全体で小さな HPL ワークロードを実行して、正当性を確認します。
問題サイズを大きくして、実際のテストロードを実行します。実際のサイズで少なくとも 3 回実行します。
問題が発生した場合は、ステップ 2 に戻ります。

警告

すべてのステップを実行することが重要です。例えば、ステップ 4 を省略すると、多くの時間が無駄になります。

ノード間ヘテロジニアス実行を行う前に、最初にホモジニアスの等価な実行を行ってください。ノード内ヘテロジニアスのオフロードモードでインテル® Xeon Phi™ コプロセッサーを使用する場合は、インテル® Xeon Phi™ コプロセッサー単独で最初に実行してください。

最適化に関する注意事項
インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。注意事項の改訂 #20110804

最適化に関する注意事項

インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。

注意事項の改訂 #20110804