インテル® MKL 2017 デベロッパー・ガイド
Intel® Optimized MP LINPACK Benchmark のハイブリッド・オフロード・バイナリーは、実行中に検出されたインテル® Xeon Phi™ コプロセッサーの数を知らせます。出力の最初に、次のような行が含まれます。
Number of Intel Xeon Phi coprocessors (インテル® Xeon Phi™ コプロセッサーの数): 1
この場合、MPI プロセスあたり 1 つのインテル® Xeon Phi™ コプロセッサーが検出されています。
インテル® Xeon Phi™ コプロセッサーがクラスターで利用可能で、オフロードするように設定しているのに 0 が出力される場合、正しいコンパイラー環境がオフロードされていない可能性があります。
ハイブリッド・オフロード・バイナリー固有の環境変数を使用して実行の動作を調整することができます。サポートしている環境変数のリストは、「ハイブリッド・オフロードの環境変数」を参照してください。また、ハイブリッド・オフロード・バイナリーは、インテル® Xeon Phi™ コプロセッサーの自動オフロード用の MKL_MIC_ENABLE および OFFLOAD_DEVICES 環境変数にも影響を受けます。
スクリプト runme_intel64.bat は、MPI ランクがコプロセッサーを最適に共有するように、指定されたノードあたりの MPI ランク数とノードあたりのインテル® Xeon Phi™ コプロセッサーの数について HPL 環境変数 (HPL_MIC_DEVICE や HPL_MIC_SHAREMODE など) を設定します。クラスター構成に応じて、これらのスクリプトの一番上に次の変数を設定します。
MPI_PROC_NUM |
MPI プロセスの総数。 |
MPI_PER_NODE |
各クラスターノードあたりの MPI プロセスの数。 ヒント最高の HPL パフォーマンスを得るには、不均等メモリーアクセス (NUMA) を有効にして、MPI_PER_NODE を NUMA ソケットの数と等しくなるように設定します。 |
NUMMIC |
各クラスターノードあたりのインテル® Xeon Phi™ コプロセッサーの数。 |
スクリプトは、指定された MPI プロセス数でハイブリッド・オフロード HPL バイナリーを起動し、結果を出力ファイルに書き込みます。
最適化に関する注意事項 |
---|
インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。 注意事項の改訂 #20110804 |