インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス

_mm512_i32[ext]gather_epi32/_mm512_mask_i32[ext]gather_epi32

int32 インデックスを使用して、int32 ベクトルを集約 (Gather) します。対応する命令は VPGATHERDD です。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。

構文

マスクなし

extern __m512i __cdecl _mm512_i32extgather_epi32(_m512i index, void const* mv, _MM_UPCONV_EPI32_ENUM conv, int scale, int hint);

extern __m512i __cdecl _mm512_i32gather_epi32(_m512i index, void const* mv, _MM_UPCONV_EPI32_NONE, int scale, _MM_HINT_NONE);

マスク付き

extern __m512i __cdecl _mm512_mask_i32extgather_epi32(_m512 v1_old, __mmask16 k1, __m512i index, void const* mv, _MM_UPCONV_EPI32_ENUM conv, int scale, int hint);

extern __m512i __cdecl _mm512_mask_i32gather_epi32(_m512 v1_old, __mmask16 k1, __m512i index, void const* mv, _MM_UPCONV_EPI32_NONE, int scale, _MM_HINT_NONE);

引数

v1_old

デスティネーション・ベクトルの古い値を保持するソースベクトル。マスクビットが 0 にセットされている場合は、v1_old の対応する要素が結果ベクトルにコピーされます。

k1

書き込みマスク。k1 マスクの対応するビットが '1' にセットされているソースベクトルの要素のみ計算され、結果に格納されます。k1 の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル v1_old の要素からコピーされます。

index

メモリー mv のインデックスを含む int32 ベクトル。

mv

メモリーのベースアドレスへのポインター

conv

順方向変換の種類。次のいずれかになります。

  • _MM_UPCONV_EPI32_NONE - 変換なし
  • _MM_UPCONV_EPI32_UINT8 - uint8 => uint32
  • _MM_UPCONV_EPI32_SINT8 - sint8 => sint32
  • _MM_UPCONV_EPI32_UINT16 - uint16 => uint32
  • _MM_UPCONV_EPI32_SINT16 - sint16 => sint32

scale

要素のアドレスを計算するスケールファクター。次の値を使用できます: 1、2、4、および 8。メモリーの i 番目の要素のアドレスは、次のように計算されます。mv + index[i] * scale

hint

プロセッサーにデータが非テンポラルでないことを示すヒント。0 または 1 を使用できます。それぞれの値の意味は次のとおりです。

  • _MM_HINT_NONE = 0
  • _MM_HINT_NT = 1 (ロードは非テンポラル)

説明

ベースアドレス mv と int32 インデックス・ベクトル index により指定される 16 のメモリー位置に対して、スケールファクター scale を使用して順方向変換を行い、結果を int32 ベクトルに集約 (Gather) します。

マスク付きの結果ベクトルには、書き込みマスクベクトル k1 の対応するビットがセットされている要素がコピーされます。マスク付きの結果ベクトルの残りの要素には、v1_old の要素がコピーされます。

マスクなしの組込み関数は、フルマスク (k1=0xffff) のマスク付き組込み関数と同等です。

これらの組込み関数は、ブロードキャストをサポートしていません。

戻り値

順方向変換ロード操作の結果。