インテル® C++ コンパイラー XE 13.1 ユーザー・リファレンス・ガイド
int32 インデックスを使用して、float32 ベクトルを集約 (Gather) プリフェッチします。対応する命令は VGATHERPF0DPS および VGATHERPF1DPS です。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。
マスクなし extern void __cdecl _mm512_prefetch_i32extgather_ps(__m512i index, void const* mv, _MM_UPCONV_PS_ENUM conv, int scale, int pf_hint); extern void __cdecl _mm512_prefetch_i32gather_ps(__m512i index, void const* mv, int scale, int pf_hint); |
マスク付き extern void __cdecl _mm512_mask_prefetch_i32extgather_ps(__m512i index, __mmask16 k1, void const* mv, _MM_UPCONV_PS_ENUM conv, int scale, int pf_hint); extern void __cdecl _mm512_mask_prefetch_i32gather_ps(__m512i index, __mmask16 k1, void const* mv, int scale, int pf_hint); |
k1 |
書き込みマスク。k1 書き込みマスクの対応するビットが '1' にセットされているソースメモリーの要素のみプリフェッチされます。 |
index |
メモリー mv のインデックスを含む int32 ベクトル。 下位の 8 つの要素のみインデックスとして使用されます。上位の 8 つの要素は使用されません。 |
mv |
メモリーのベースアドレスへのポインター |
conv |
|
scale |
要素のアドレスを計算するスケールファクター。次の値を使用できます: 1、2、4、および 8。メモリーの i 番目の要素のアドレスは、次のように計算されます。mv + index[i] * scale |
pf_hint |
|