インテル® MKL 2017 デベロッパー・ガイド
関数のパラメーターが多い場合や関数でパラメーター・エラーを内部的にチェックする場合、小さな問題サイズではインテル® MKL 関数呼び出しのオーバーヘッドが大きくなります。これらの小さな問題サイズのパフォーマンス・オーバーヘッドを軽減するため、インテル® MKL の直接呼び出し機能は、コンパイラーと連携して ?gemm 関数の呼び出しパラメーターを前処理し、エラーチェックを省略する特別に最適化された小行列カーネルを直接呼び出すかインライン展開します。
この機能を有効にするには、次の操作を行います。
C または Fortran コードのコンパイルでは、インテル® MKL のモード (マルチスレッドあるいはシーケンシャル) に応じて、以下のプリプロセッサー・マクロとコンパイラー・オプションを指定します。
インテル® MKL のモード |
マクロ |
コンパイラー・オプション |
---|---|---|
マルチスレッド |
MKL_DIRECT_CALL | /DMKL_DIRECT_CALL |
シーケンシャル |
MKL_DIRECT_CALL_SEQ | /DMKL_DIRECT_CALL_SEQ |
Fortran アプリケーションの場合:
問題サイズが小さい場合、インテル® MKL はエラーチェックと中間の関数呼び出しを省略します (例えば、行列ランクが 50 未満の dgemm 関数呼び出し)。
最適化に関する注意事項 |
---|
インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。 注意事項の改訂 #20110804 |