インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
指定されたクワッドワードのマスク値を使用して、指定されたベースアドレス、クワッドワードのインデックス、およびスケールによるメモリー参照から 2 つまたは 4 つのクワッドワード値を集約 (Gather) します。対応するインテル® AVX2 命令は VPGATHERQQ です。
extern __m128i _mm_mask_i64gather_epi64(__m128i def_vals, __int64 const * base, __m128i vindex, __m128i vmask, const int scale); |
extern __m256i _mm256_mask_i64gather_epi64(__m128i def_vals, __int64 const * base, __m256i vindex, __m256i vmask, const int scale); |
def_val |
ベクトルマスクの対応する要素が '0' の場合にデスティネーションにコピーされるクワッドワード値のベクトル。 |
base |
ロードされるクワッドワード要素の参照に使用するベースアドレス |
vindex |
ロードされるクワッドワード要素の参照に使用するクワッドワード・インデックスのベクトル |
vmask |
ベクトルマスクとして使用されるクワッドワード要素のベクトル。各クワッドワードの最上位ビットのみがマスクとして使用されます。 |
scale |
コンパイル時のリテラル定数。ロードされる要素のアドレスを指定するベクトル・インデックス・スケールとして使用されます。次のいずれかの値を指定してください: 1、2、4、8。 |
ベースアドレス、クワッドワードのインデックス、および 64 ビットのスケールを使用して、メモリーから 2 つまたは 4 つのクワッドワード値を条件付きでロードします。
以下にこの組込み関数の擬似コードを示します。
_mm_mask_i64gather_epi64():
result[63:0] = (vmask[63]==1) ? (mem[base+vindex[63:0]*scale]) : (def_vals[63:0]); result[127:64] = (vmask[127]==1) ? (mem[base+vindex[127:64]*scale]) : (def_vals[127:64]);
_mm256_mask_i64gather_epi64():
result[63:0] = (vmask[63]==1) ? (mem[base+vindex[63:0]*scale]) : (def_vals[63:0]); result[127:64] = (vmask[127]==1) ? (mem[base+vindex[127:64]*scale]) : (def_vals[127:64]); result[191:128] = (vmask[191]==1) ? (mem[base+vindex[191:128]*scale]) : (def_vals[191:128]); result[255:192] = (vmask[255]==1) ? (mem[base+vindex[255:192]*scale]) : (def_vals[255:192]);
integer64 値を条件付きで集約した 128/256 ビットのベクトル。