インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
ここでは、コードの並列化に役立つ特定の C++ 言語機能について説明します。
次のように、関数に宣言を付けると、より多くのループと直列型コードを並列化するようにコンパイラーに指示できます。
// (Windows*) __declspec(concurrency_safe(cost(cycles) | profitable)) - または - // (Linux*) __attribute__(concurrency_safe(cost(cycles) | profitable))より多くのループと直列型コードを並列化するようにコンパイラーに指示します。
concurrency_safe 属性の使用は、アノテーション付けした関数の複数の呼び出し間、またはこの関数とプログラムの別の文 (同時に実行されていれば) の間で、影響を受けない副作用はないこと、不正な (または不適切に同期化された) メモリー・アクセス・インターフェイスはないことをコンパイラーに示します。
concurrency_safe 属性を付けた各関数について、副作用 (ある場合) を許容範囲 (または想定範囲) 内に抑え、メモリー・アクセス・インターフェイスを適切に同期化することは開発者の責任です。
cost 節は、アノテーション付けした関数の実行サイクルを指定して、その囲まれたループやブロックのコンパイル中にコンパイラーが並列化の有効性解析を実行できるようにします。profitable 節は、アノテーション付けした関数への呼び出しを含むループまたはブロックの並列化が有効であることを示します。
cycles の値は 2 バイトの符号なし整数 (unsigned short) で、最大値は 2^16-1 です。サイクルカウントが 2^16-1 を超える場合、profitable 節を使用してください。
次の例は、この宣言の使用方法を示します。
__declspec(concurrency_safe(cost(cycles) | profitable)) の使用例 |
---|
#define N 10 #define M 40 #define NValue N #if defined(COSTLOW) // この関数は ~5 サイクル、"foo" を呼び出すループは並列化されない __declspec(concurrency_safe(cost(5))) #elif defined(COSTHIGH) // この関数は ~100 サイクル、"foo" を呼び出すループは並列化される __declspec(concurrency_safe(cost(200))) #elif defined(PROFITABLE) // この関数の並列実行は有効 // "foo" を呼び出すループは並列化すべき __declspec(concurrency_safe(profitable)) #endif __declspec(noinline) int foo(float A[], float B[]) { for (int i = 0; i < N; i++) { B[i] = A[i]; } return N; } int testp(float A[], float B[], float* In[], float* Out[]) { int i, j; for (i = 0; i < M; i++) { foo (A, B); for (j = 0; j < N; j++) { Out[i][j] = In[i][j] + (NValue*j); } } return N; } [C:/temp] icl -c -DCOSTLOW -Qparallel -Qpar-report2 -Qansi-alias v.cpp C:\temp\v.cpp(28): (列 3) リマーク: ループは並列化されませんでした: 計算量が不足しています。 [C:/temp] icl -c -DCOSTHIGH -Qparallel -Qpar-report -Qansi-alias v.cpp C:\temp\v.cpp(28): (列 3) リマーク: ループが自動並列化されました。 [C:/temp] icl -c -DPROFITABLE -Qparallel -Qpar-report -Qansi-alias v.cpp C:\temp\v.cpp(28): (列 3) リマーク: ループが自動並列化されました。 |