_mm_mask_i32gather_ps、_mm256_mask_i32gather

インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス

指定された単精度浮動小数点マスク値を使用して、指定されたベースアドレス、ダブルワードのインデックス、およびスケールによるメモリー参照から 2 つまたは 4 つのパックド単精度浮動小数点値を集約 (Gather) します。対応するインテル® AVX2 命令は VGATHERDPS です。

構文

extern __m128 _mm_mask_i32gather_ps(__m128 def_vals, float const * base, __m128i vindex __m128 vmask, const int scale);

extern __m256 _mm256_mask_i32gather_ps(__m256 def_vals, float const * base, __m256i vindex __m256 vmask, const int scale);

引数

`def_vals`	単精度浮動小数点マスクの対応する要素が '0' の場合にデスティネーションにコピーされる単精度浮動小数点値のベクトル
`base`	ロードされる浮動小数点要素の参照に使用するベースアドレス
`vindex`	ロードされる浮動小数点要素の参照に使用するダブルワード・インデックスのベクトル
`vmask`	ベクトルマスクとして使用される浮動小数点要素のベクトル。各データ要素の最上位ビットのみがマスクとして使用されます。
`scale`	コンパイル時のリテラル定数。ロードされる要素のアドレスを指定するベクトル・インデックス・スケールとして使用されます。次のいずれかの値を指定してください: 1、2、4、8。

説明

マスク値に応じて、ダブルワードのインデックスを使用して、メモリーから 2 つまたは 4 つのパックド単精度浮動小数点値を条件付きでロードします。

以下にこの組込み関数の擬似コードを示します。

_mm_mask_i32gather_ps():

result[31:0] = (vmask[31]==1) ? (mem[base+vindex[31:0]*scale]) : (def_vals[31:0]);
result[63:32] = (vmask[63]==1) ? (mem[base+vindex[63:32]*scale]) : (def_vals[63:32]);
result[95:64] = (vmask[95]==1) ? (mem[base+vindex[95:64]*scale]) : (def_vals[95:64]);
result127:96] = (vmask[127]==1) ? (mem[base+vindex[127:96]*scale]) : (def_vals[127:96]);

_mm256_mask_i32gather_ps():

result[31:0] = (vmask[31]==1) ? (mem[base+vindex[31:0]*scale]) : (def_vals[31:0]);
result[63:32] = (vmask[63]==1) ? (mem[base+vindex[63:32]*scale]) : (def_vals[63:32]);
result[95:64] = (vmask[95]==1) ? (mem[base+vindex[95:64]*scale]) : (def_vals[95:64]);
result127:96] = (vmask[127]==1) ? (mem[base+vindex[127:96]*scale]) : (def_vals[127:96]);
result[159:128] = (vmask[159]==1) ? (mem[base+vindex[159:128]*scale]) : (def_vals[159:128]);
result[191:160] = (vmask[191]==1) ? (mem[base+vindex[191:160]*scale]) : (def_vals[191:160]);
result[223:192] = (vmask[223]==1) ? (mem[base+vindex[223:192]*scale]) : (def_vals[223:192]);
result[255:224] = (vmask[255]==1) ? (mem[base+vindex[255:224]*scale]) : (def_vals[255:224]);

戻り値

単精度浮動小数点値を条件付きで集約した 128/256 ビットのベクトル。

_mm_mask_i32gather_ps、_mm256_mask_i32gather_ps

構文

引数

説明

戻り値