スレッドを処理するコアが変更されないようにすることで、マルチコア・プロセッサーのシステムで最良のパフォーマンスを得ることができます。 このためには、スレッドにアフィニティー・マスクを設定し、スレッドと CPU コアをバインドします。 以下のいずれかのオプションを入力します。
以下のパフォーマンス問題について考えてみます。
以下のコードサンプルは、オペレーティング・システムでアフィニティー・マスクを設定してこの問題を解決する方法を示しています。このコードは、システム関数 SetThreadAffinityMask を呼び出して適切なコアにスレッドをバインドし、スレッドを処理するコアが変更されないようにします。 その後、インテル® MKL LAPACK ルーチンが呼び出されます。
// アフィニティー・マスクを設定します。 #include <windows.h> #include <omp.h> int main(void) { #pragma omp parallel default(shared) { int tid = omp_get_thread_num(); // 2 パッケージ x 2 コア/パッケージ x 1 スレッド/コア (4 コア) DWORD_PTR mask = (1 << (tid == 0 ? 0 : 2 )); SetThreadAffinityMask( GetCurrentThread(), mask ); } // インテル® MKL LAPACK ルーチンを呼び出します。 return 0; }
インテル® コンパイラーで、以下のコマンドを使用してアプリケーションをコンパイルします。
icl /Qopenmp test_application.c
test_application.c は、アプリケーションのファイル名です。
アプリケーションをビルドします。例えば、次のように環境変数を使用してスレッド数を設定し、ビルドしたアプリケーションを 4 スレッドで実行します。
set OMP_NUM_THREADS=4 test_application.exe
Windows API ルーチンの使用における制限と上記の例で使用されている SetThreadAffinityMask 関数の詳細については、Windows API ドキュメント (msdn .microsoft .com/) を参照してください。
en.wikipedia.org/wiki/Affinity_mask (英語) の例も参照してください。
© 2007 - 2010 Intel Corporation. 無断での引用、転載を禁じます。