インテル® MKL 11.3 ユーザーズガイド

小さな問題サイズのパフォーマンス向上

関数のパラメーターが多い場合や関数でパラメーター・エラーを内部的にチェックする場合、小さな問題サイズではインテル® MKL 関数呼び出しのオーバーヘッドが大きくなります。これらの小さな問題サイズのパフォーマンス・オーバーヘッドを軽減するため、インテル® MKL の直接呼び出し機能は、コンパイラーと連携して ?gemm 関数の呼び出しパラメーターを前処理し、エラーチェックを省略する特別に最適化された小行列カーネルを直接呼び出すかインライン展開します。

この機能を有効にするには、次の操作を行います。

問題サイズが小さい場合、インテル® MKL はエラーチェックと中間の関数呼び出しを省略します (例えば、行列ランクが 50 未満の dgemm 関数呼び出し)。

最適化に関する注意事項

インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。

改訂 #20110804