インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス
int32 インデックスを使用して、float64 ベクトルを集約 (Gather) します。対応する命令は VGATHERDPD です。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。
マスクなし extern __m512d __cdecl _mm512_i32loextgather_pd(_m512i index, void const* mv, _MM_UPCONV_PD_ENUM conv, int scale, int hint); extern __m512d __cdecl _mm512_i32logather_pd(__m512i index, void const* mv, _MM_UPCONV_EPI64_ENUM conv, int scale, _MM_HINT_NONE); |
マスク付き extern __m512d __cdecl _mm512_mask_i32loextgather_pd(_m512d v1_old, __mmask8 k1, __m512i index, void const* mv, _MM_UPCONV_PD_ENUM conv, int scale, int hint); extern __m512d __cdecl _mm512_mask_i32logather_pd(_m512d v1_old, __mmask8 k1, __m512i index, void const* mv, _MM_UPCONV_PD_ENUM conv, int scale, _MM_HINT_NONE); |
v1_old |
デスティネーション・ベクトルの古い値を保持するソースベクトル。マスクビットが 0 にセットされている場合は、v1_old の対応する要素が結果ベクトルにコピーされます。 |
k1 |
書き込みマスク。k1 マスクの対応するビットが '1' にセットされているソースベクトルの要素のみ計算され、結果に格納されます。k1 の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル v1_old の要素からコピーされます。 |
index |
メモリー mv のインデックスを含む int32 ベクトル。 下位の 8 つの要素のみインデックスとして使用されます。上位の 8 つの要素は使用されません。 |
mv |
メモリーのベースアドレスへのポインター |
conv |
順方向変換の種類。次のいずれかになります。
|
scale |
要素のアドレスを計算するスケールファクター。次の値を使用できます: 1、2、4、および 8。メモリーの i 番目の要素のアドレスは、次のように計算されます。mv + index[i] * scale |
hint |
プロセッサーにデータが非テンポラルでないことを示すヒント。0 または 1 を使用できます。それぞれの値の意味は次のとおりです。
|
ベースアドレス mv と int32 インデックス・ベクトル index の下位の 8 つの要素により指定される 8 つのメモリー位置に対して、スケールファクター scale を使用して順方向変換を行い、結果を float64 ベクトルに集約 (Gather) します。
マスク付きの結果ベクトルには、書き込みマスクベクトル k1 の対応するビットがセットされている要素がコピーされます。マスク付きの結果ベクトルの残りの要素には、v1_old の要素がコピーされます。
マスクなしの組込み関数は、フルマスク (k1=0xffff) のマスク付き組込み関数と同等です。
これらの組込み関数は、ブロードキャストをサポートしていません。
順方向変換ロード操作の結果。