インテル® MKL 2017 デベロッパー・ガイド
クラスター・アプリケーションのパフォーマンスを向上するには、インテル® MKL が最適なスレッド数と正しいスレッド・アフィニティーを使用することが不可欠です。通常、最適なスレッド数は、ノードあたりの利用可能なコア数を、ノードあたりの MPI プロセス数で割った値です。「スレッド数を設定する手法」にあるいずれかの手法でスレッド数を設定できます。
スレッド数が設定されていない場合、インテル® MKL は、インテル® MPI ライブラリーによって提供される MPI プロセスで実行されるかどうかを確認します。MPI プロセスで実行される場合、次の環境変数によりインテル® MKL スレッドの動作が定義されます。
スレッドの動作は、I_MPI_THREAD_LEVEL の値に依存します。
0 または未定義。
インテル® MKL は、インテル® MPI ライブラリーのスレッド・サポート・レベルが MPI_THREAD_SINGLE であると見なし、シーケンシャル実行をデフォルトに設定します。
1、2、または 3。
インテル® MKL は、次のスレッド・サポート・レベルであると見なします。
いずれの場合も、インテル® MKL は、前述のほかの環境変数を使用してノードあたりの MPI プロセス数を決定し、ノードあたりの利用可能なスレッド数をノードあたりの MPI プロセス数で割った値をスレッド数のデフォルトに設定します。
ここで説明した暗黙的な設定に頼らず、インテル® MKL のスレッド数を明示的に設定します。
最適化に関する注意事項 |
---|
インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。 注意事項の改訂 #20110804 |