クラスターのパフォーマンスを向上する

シングルノードの HPL テストでハイパフォーマンスを得るのは比較的簡単ですが、クラスターではより困難です。クラスターの HPL テストでハイパフォーマンスを得るには、次の手順に従います。ここでは、各ノードで必要なすべてのインストールが完了していると仮定しています。

すべてのノードを再起動します。
すべてのノードが同一条件で、以前の HPL 実行のプロセスが実行されていないことを確認します。

各ノードでシングルノードの Stream と HPL LINPACK またはインテル® MKL プログラム nodeperf を実行します。詳細は、「クラスターにおける結果の最適化」を参照してください。それぞれの結果の差異が 2% 以内であることを確認します (問題サイズは、メモリーサイズと CPU の動作速度に対して十分な大きさでなければなりません)。パフォーマンスの低いノードでハードウェア/ソフトウェアの問題の可能性を調査します。
クラスターのインターコネクトが動作していることを確認します。MPI テストを使用して、クラスター全体の帯域幅とレイテンシーをテストします。
2 ノードまたは 4 ノードのペアで HPL ベンチマークを実行し、それぞれの結果の差異が 4% 以内になることを確認します。問題サイズは、メモリーサイズと CPU の動作速度に対して十分な大きさでなければなりません (例えば、こちらを参照してください)。
クラスター全体で小さな HPL ワークロードを実行して、正当性を確認します。
問題サイズを大きくして、実際のテストロードを実行します。実際のサイズで少なくとも 3 回実行します。
問題が発生した場合は、ステップ 2 に戻ります。

警告

すべてのステップを実行することが重要です。例えば、ステップ 4 を省略すると、多くの時間が無駄になります。

ノード間ヘテロジニアス実行を行う前に、最初にホモジニアスの等価な実行を行ってください。ノード内ヘテロジニアスのオフロードモードでインテル® Xeon Phi™ コプロセッサーを使用する場合は、インテル® Xeon Phi™ コプロセッサー単独で最初に実行してください。

最適化に関する注意事項
インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。改訂 #20110804

最適化に関する注意事項

インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。

改訂 #20110804