インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス

_mm_mask_i64gather_pd/_mm256_mask_i64gather_pd

指定された倍精度浮動小数点マスク値を使用して、指定されたベースアドレス、クワッドワードのインデックス、およびスケールによるメモリー参照から 2 つまたは 4 つのパックド倍精度浮動小数点値を集約 (Gather) します。対応するインテル® AVX2 命令は VGATHERQPD です。

構文

extern __m128d _mm_mask_i64gather_pd(__m128d def_vals, double const * base, __m128i vindex __m128d vmask, const int scale);

extern __m256d _mm256_mask_i64gather_pd(__m256d def_vals, double const * base, __m128i vindex __m256d vmask, const int scale);

引数

def_vals

倍精度浮動小数点マスクの対応する要素が '0' の場合にデスティネーションにコピーされる倍精度浮動小数点値のベクトル

base

ロードされる浮動小数点要素の参照に使用するベースアドレス

vindex

ロードされる浮動小数点要素の参照に使用するクワッドワード・インデックスのベクトル

vmask

ベクトルマスクとして使用される浮動小数点要素のベクトル。各データ要素の最上位ビットのみがマスクとして使用されます。

scale

ロードされる浮動小数点要素の参照に使用する 32 ビットのスケール

説明

マスク値に応じて、クワッドワードのインデックスを使用して、メモリーから 2 つまたは 4 つのパックド倍精度浮動小数点値を条件付きでロードします。

以下にこの組込み関数の擬似コードを示します。

_mm_mask_i64gather_pd():

result[63:0] = (vmask[63]==1) ? (mem[base+vindex[63:0]*scale]) : (def_vals[63:0]);
result[127:64] = (vmask[127]==1) ? (mem[base+vindex[127:64]*scale]) : (def_vals[127:64]);

_mm256_mask_i64gather_pd():

result[63:0] = (vmask[63]==1) ? (mem[base+vindex[63:0]*scale]) : (def_vals[63:0]);
result[127:64] = (vmask[127]==1) ? (mem[base+vindex[127:64]*scale]) : (def_vals[127:64]);
result[191:128] = (vmask[191]==1) ? (mem[base+vindex[191:128]*scale]) : (def_vals[191:128]);
result[255:192] = (vmask[255]==1) ? (mem[base+vindex[255:192]*scale]) : (def_vals[255:192]);

戻り値

倍精度浮動小数点値を条件付きで集約した 128/256 ビットのベクトル。