インテル® C++ コンパイラー 16.0 ユーザー・リファレンス・ガイド

prefetch/noprefetch

コンパイラーにより、メモリーからのデータ・プリフェッチ要求を発行または無効にします。このプラグマは、インテル® MIC アーキテクチャーにのみ適用されます。

構文

#pragma prefetch

#pragma prefetch *:hint[:distance]

#pragma prefetch [var1 [: hint1 [: distance1]] [, var2 [: hint2 [: distance2]]]...]

#pragma noprefetch [var1 [, var2]...]

引数

var

オプションのメモリー参照 (プリフェッチされるデータ)

hint

プリフェッチの型を指定するコンパイラーへのオプションのヒント。設定可能な値は、xmmintrin.h ヘッダーで定義される定数です。

  • _MM_HINT_T0 - 再利用される整数データの場合

  • _MM_HINT_T1 - L2 キャッシュから再利用される整数データと浮動小数点データの場合

  • _MM_HINT_T2 - L3 キャッシュから再利用されるデータの場合

  • _MM_HINT_NTA - 再利用されないデータの場合

この引数を使用するには、var も指定してください。

distance

オプションの引数 (1 以上の値)。対応するロード命令やストア命令の前に、プリフェッチの発行に先立ってループの反復数を示します。この引数を使用するには、varhint も指定してください。

説明

このプラグマは、コンパイラーにメモリーのデータ・プリフェッチを生成するヒントを与えます。これのヒントは、コンパイラーが使用するヒューリスティックに影響します。データをプリフェッチすると、メモリー・レイテンシーの影響を最小限に抑えられます。

引数を使用せずに prefetch プラグマを指定すると、直後のループにアクセスされたすべての配列がプリフェッチされます。

ループの前に #pragma prefetch を置いて、ループ内で式 A(j) を使用する場合、コンパイラーはループ内の A(j+d) にプリフェッチを挿入します。ここで、d はデータをプリフェッチするための残りの反復回数で、コンパイラーによって決定されます。

#pragma prefetch * を指定すると、hintdistance はループのすべての配列アクセスをプリフェッチします。

これらのプラグマを使用するには、[Q]opt-prefetch コンパイラー・オプションを指定する必要があります (コンパイラーの全般の最適化レベルが O2 以上の場合はデフォルトでオンになります)。

noprefetch プラグマは、コンパイラーにメモリーのデータ・プリフェッチを生成しないようヒントを与えます。これは、コンパイラーが使用するヒューリスティックに影響します。

prefetch プラグマの使用例

#pragma prefetch htab_p:1:30 
#pragma prefetch htab_p:0:6

// Issue vprefetch1 for htab_p with a distance of 30 vectorized iterations ahead
// Issue vprefetch0 for htab_p with a distance of 6 vectorized iterations ahead
// If pragmas are not present, compiler chooses both distance values 

for (j=0; j<2*N; j++) { htab_p[i*m1 + j] = -1; }

noprefetch および prefetch プラグマの使用例

#pragma noprefetch b
#pragma prefetch a 
for(i=0; i<m; i++) { a[i]=b[i]+1; }

noprefetch および prefetch プラグマの使用例

for (i=i0; i!=i1; i+=is) {
 
float sum = b[i]; 
int ip = srow[i]; 
int c = col[ip];

#pragma noprefetch col 
#pragma prefetch value:1:80 
#pragma prefetch x:1:40

for(; ip<srow[i+1]; c=col[++ip])
  sum -= value[ip] * x[c];
  y[i] = sum; 
}