インテル® MKL 2018 デベロッパー・ガイド
インテル® Distribution for LINPACK Benchmark は、インテル® Xeon Phi™ コプロセッサーの自動オフロード用の MKL_MIC_ENABLE および OFFLOAD_DEVICES 環境変数に影響を受けます。また、実行中に検出されたインテル® Xeon Phi™ コプロセッサーの数を知らせます。出力の最初に、次のような行が含まれます。
Number of Intel Xeon Phi coprocessors (インテル® Xeon Phi™ コプロセッサーの数): 1
インテル® Xeon Phi™ コプロセッサーがクラスターで利用可能で、オフロードするように設定しているのに 0 が出力される場合、正しいコンパイラー環境がオフロードされていない可能性があります。特に、LD_LIBRARY_PATH 環境変数に、インテル® メニーコア・プラットフォーム・ソフトウェア・スタック (インテル® MPSS) でインストールされる共有ライブラリー libcoi_host.so.0 および libscif.so.0 が含まれているかどうかを確認してください。
環境変数を使用して実行の動作を調整することができます。サポートしている環境変数のリストは、「環境変数」を参照してください。NUMMIC 変数は、クラスターノードごとのインテル® Xeon Phi™ コプロセッサーの数を示します。HPL_MIC_DEVICE および HPL_MIC_SHAREMODE 環境変数を使用して、MPI プロセス間でインテル® Xeon Phi™ コプロセッサーを共有できます。スクリプト runme_intel64_dynamic.bat は、指定されたノードごとの MPI ランク数に合わせて、これらの環境変数を設定します。
ブロックサイズ NB と問題サイズ N パラメーターを適切な値に調整してください。次の表は、ノードごとのインテル® Xeon Phi™ コプロセッサーの数に応じた NB の推奨値を示します。値は PCI Express の設定およびメインメモリーのパフォーマンスに応じて異なります。
1 コプロセッサー |
2 コプロセッサー |
---|---|
896 |
1280 |
ただし、NB を大きな値にするには、ホスト・プロセッサーとコプロセッサーで追加のメモリーが必要になります。メモリーが小さい場合、問題サイズ N は N >> NB を満たしません。その場合、インテル® Distribution for LINPACK Benchmark をオフロードモードで使用しないほうが良いでしょう。
最適化に関する注意事項 |
---|
インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。 注意事項の改訂 #20110804 |