インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス

_mm_mask_i64gather_epi32、_mm256_mask_i64gather_epi32

指定されたダブルワードのマスク値を使用して、指定されたベースアドレス、クワッドワードのインデックス、およびスケールによるメモリー参照から 2 つまたは 4 つのダブルワード値を集約 (Gather) します。対応するインテル® AVX2 命令は VPGATHERQD です。

構文

extern __m128i _mm_mask_i64gather_epi32(__m128i def_vals, int const * base, __m128i vindex, __m128i vmask, const int scale);

extern __m256i _mm256_mask_i64gather_epi32(__m128i def_vals, int const * base, __m256i vindex, __m128i vmask, const int scale);

引数

def_val

ベクトルマスクの対応する要素が '0' の場合にデスティネーションにコピーされるダブルワード値のベクトル

base

ロードされるダブルワード要素の参照に使用するベースアドレス

vindex

ロードされるダブルワード要素の参照に使用するクワッドワード・インデックスのベクトル

vmask

ベクトルマスクとして使用されるダブルワード要素のベクトル。各ダブルワードの最上位ビットのみがマスクとして使用されます。

scale

コンパイル時のリテラル定数。ロードされる要素のアドレスを指定するベクトル・インデックス・スケールとして使用されます。次のいずれかの値を指定してください: 1、2、4、8。

説明

ベースアドレス、クワッドワードのインデックス、および 32 ビットのスケールを使用して、メモリーから 2 つまたは 4 つのダブルワード値を条件付きでロードします。組込み関数 _mm_mask_i64gather_epi32() は、結果の上位 64 ビットも '0' に設定します。

以下にこの組込み関数の擬似コードを示します。

_mm_mask_i64gather_epi32():

result[31:0] = (vmask[31]==1) ? (mem[base+vindex[63:0]*scale]) : (def_vals[31:0]);
result[63:32] = (vmask[63]==1) ? (mem[base+vindex[127:64]*scale]) : (def_vals[63:32]);
result[127:64] = 0;

_mm256_mask_i64gather_epi32():

result[31:0] = (vmask[31]==1) ? (mem[base+vindex[63:0]*scale]) : (def_vals[31:0]);
result[63:32] = (vmask[63]==1) ? (mem[base+vindex[127:64]*scale]) : (def_vals[63:32]);
result[95:64] = (vmask[95]==1) ? (mem[base+vindex[191:128]*scale]) : (def_vals[95:64]);
result[127:96] = (vmask[127]==1) ? (mem[base+vindex[255:192]*scale]) : (def_vals[127:96]);

戻り値

integer32 値を条件付きで集約した 128/256 ビットのベクトル。