インテル® MKL 11.3 ユーザーズガイド

スレッド化を使用してパフォーマンスを向上する

インテル® MKL は広範囲に並列化されます。スレッド化可能な関数と問題の一覧は、「OpenMP* によりスレッド化される関数と問題」および「インテル® TBB によりスレッド化される関数」を参照してください。

インテル® MKL はスレッドセーフです (LAPACK の非推奨ルーチン ?lacon を除く)。すべてのインテル® MKL 関数は、複数のスレッドで同時に実行されている場合でも正常に動作します。データの共有部分へのアクセスが 1 つのスレッドに制限されている場合でも、スレッド化されたインテル® MKL のコードは、複数のスレッドから同じ共有データにアクセスできます。このため、複数のスレッドからインテル® MKL を呼び出しても関数のインスタンスが干渉することを心配する必要はありません。

OpenMP* スレッディング・テクノロジーを使用する場合、OMP_NUM_THREADS 環境変数を使用してスレッド数を指定したり、等価な OpenMP* ランタイム関数呼び出しを使用することができます。インテル® MKL では、MKL_NUM_THREADS のような OpenMP* 環境変数とは独立した変数と等価なインテル® MKL 関数をスレッド管理に使用することもできます。インテル® MKL 変数は常に最初に検査され、次に OpenMP* 変数が検査されます。どちらの変数も使用されていない場合、OpenMP* ソフトウェアはデフォルトのスレッド数を選択します。

デフォルトでは、インテル® MKL は OpenMP* スレッド数をシステムの物理コアの数と同じ数に設定します。

インテル® TBB スレッディング・テクノロジーを使用する場合、OMP_NUM_THREADS 環境変数や MKL_NUM_THREADS 関数のような OpenMP* スレッド化コントロールは効果がありません。インテル® TBB アプリケーション・プログラミング・インターフェイスを使用してスレッド数を制御します。

より高いパフォーマンスを得るには、「スレッド数を設定する手法」で説明されているように、スレッド数をプロセッサー数または物理コア数に設定してください。

最適化に関する注意事項

インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。

改訂 #20110804

関連情報