インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス

_mm512_prefetch_i32[ext]gather_ps/_mm512_mask_prefetch_i32[ext]gather_ps

int32 インデックスを使用して、float32 ベクトルを集約 (Gather) プリフェッチします。 対応する命令は VGATHERPF0DPS および VGATHERPF1DPS です。 この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。

構文

マスクなし

extern void __cdecl _mm512_prefetch_i32extgather_ps(__m512i index, void const* mv, _MM_UPCONV_PS_ENUM conv, int scale, int pf_hint);

extern void __cdecl _mm512_prefetch_i32gather_ps(__m512i index, void const* mv, int scale, int pf_hint);

マスク付き

extern void __cdecl _mm512_mask_prefetch_i32extgather_ps(__m512i index, __mmask16 k1, void const* mv, _MM_UPCONV_PS_ENUM conv, int scale, int pf_hint);

extern void __cdecl _mm512_mask_prefetch_i32gather_ps(__m512i index, __mmask16 k1, void const* mv, int scale, int pf_hint);

引数

k1

書き込みマスク。k1 書き込みマスクの対応するビットが '1' にセットされているソースメモリーの要素のみプリフェッチされます。

index

メモリー mv のインデックスを含む int32 ベクトル。

mv

メモリーのベースアドレスへのポインター

conv

順方向変換の種類。次のいずれかになります。

  • _MM_UPCONV_PS_NONE - 変換なし
  • _MM_UPCONV_PS_FLOAT16 - sint8 => float32
  • _MM_UPCONV_PS_UINT8 - uint8 => float32
  • _MM_UPCONV_PS_SINT8 - sint8 => float32
  • _MM_UPCONV_PS_UINT16 - uint16 => float32
  • _MM_UPCONV_PS_SINT16 - sint16 => float32

scale

要素のアドレスを計算するスケールファクター。次の値を使用できます: 1、2、4、および 8。メモリーの i 番目の要素のアドレスは、次のように計算されます。mv + index[i] * scale

pf_hint

プリフェッチのヒント。次のいずれかの値を指定します。

  • _MM_HINT_T0 - T0 ヒントを使用して L1 にプリフェッチします。
  • _MM_HINT_T1 - T1 ヒントを使用して L2 にプリフェッチします。
  • _MM_HINT_T2 - T1 および非テンポラルなヒントを使用して L2 にプリフェッチします。
  • _MM_HINT_NTA - T0 および非テンポラルなヒントを使用して L1 にプリフェッチします。

説明

ベースアドレス mv、int32 インデックス・ベクトル index、およびスケールファクター scale により指定される 16 のメモリー位置。pf_hint 引数に応じて、メモリーから L1 または L2 キャッシュにプリフェッチされます。

マスクなしの組込み関数は、フルマスク (k1=0xffff) のマスク付き組込み関数と同等です。

順方向変換が不要な場合は、関数名に ext が含まれない、単純化されたバージョンを使用できます。

戻り値

なし。