インテル® MKL 2020 デベロッパー・ガイド
クラスターのパフォーマンスを向上するには、各ノードにすべての必要なソフトウェアがインストールされていることを確認してから、次の操作を行います。
すべてのノードを再起動します。
すべてのノードが同一条件で、以前の HPL 実行のプロセスが実行されていないことを確認します。各ノードでシングルノードの Stream とインテル® Distribution for LINPACK Benchmark を実行します。それぞれの結果の差異が 10% 以内であることを確認します (問題サイズは、メモリーサイズと CPU の動作速度に対して十分な大きさでなければなりません)。パフォーマンスの低いノードでハードウェア/ソフトウェアの問題の可能性を調査します。
クラスターのインターコネクトが動作していることを確認します。MPI テスト (例えば、インテル® MPI Benchmarks パッケージに含まれる) を使用して、クラスター全体の帯域幅とレイテンシーをテストします。
2 ノードまたは 4 ノードのペアでインテル® Distribution for LINPACK Benchmark を実行し、それぞれの結果の差異が 10% 以内になることを確認します。問題サイズは、メモリーサイズと CPU の動作速度に対して十分な大きさでなければなりません。
クラスター全体で小さな問題サイズを実行して、正当性を確認します。
問題サイズを大きくして、実際のテストロードを実行します。
問題が発生した場合は、ステップ 2 に戻ります。
ヘテロジニアス実行を行う前に、最初にホモジニアスの等価な実行を行ってください。
最適化に関する注意事項 |
---|
インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。 注意事項の改訂 #20110804 |