インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス
int64 インデックスを使用して、float32 ベクトルを集約 (Gather) します。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。
マスクなし __m512 _mm512_i64extgather_pslo(_m512i index, void const* mv, _MM_UPCONV_PS_ENUM conv, int scale, int hint); __m512 _mm512_i64gather_pslo(_m512i index, void const* mv, int scale); |
マスク付き __m512 _mm512_mask_i64extgather_pslo(_m512 v1_old, __mmask8 k1, __m512i index, void const* mv, _MM_UPCONV_PS_ENUM conv, int scale, int hint); __m512 _mm512_mask_i64gather_pslo(_m512 v1_old, __mmask8 k1, __m512i index, void const* mv, int scale); |
v1_old |
デスティネーション・ベクトルの古い値を保持するソースベクトル。マスクビットが 0 にセットされている場合は、v1_old の対応する要素が結果ベクトルにコピーされます。 |
k1 |
書き込みマスク。k1 マスクの対応するビットが '1' にセットされているソースベクトルの要素のみ計算され、結果に格納されます。k1 の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル v1_old の要素からコピーされます。 |
index |
メモリー mv の 8 つのインデックスを含む int64 ベクトル。 |
mv |
メモリーのベースアドレスへのポインター |
conv |
順方向変換の種類。次のいずれかになります。
|
scale |
要素のアドレスを計算するスケールファクター。次の値を使用できます: 1、2、4、および 8。メモリーの i 番目の要素のアドレスは、次のように計算されます。mv + index[i] * scale |
hint |
プロセッサーにデータが非テンポラルでないことを示すヒント。0 または 1 を使用できます。それぞれの値の意味は次のとおりです。
|
ベースアドレス mv と int64 インデックス・ベクトル index により指定される 8 つのメモリー位置に対して、スケールファクター scale を使用して順方向変換を行い、結果を float32 ベクトルの下位 8 要素に集約 (Gather) します。
マスク付きの結果ベクトルには、書き込みマスクベクトル k1 の対応するビットがセットされている要素がコピーされます。マスク付きの結果ベクトルの残りの要素には、v1_old の要素がコピーされます。
マスクなしの組込み関数は、フルマスク (k1=0xffff) のマスク付き組込み関数と同等です。
順方向変換集約操作の結果。