インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス

_mm_i32gather_ps、_mm256_i32gather_ps

指定されたベースアドレス、ダブルワードのインデックス、およびスケールによるメモリー参照から 2 つまたは 4 つのパックド単精度浮動小数点値を集約 (Gather) します。対応するインテル® AVX2 命令は VGATHERDPS です。

構文

extern __m128 _mm_mask_i32gather_ps(float const * base, __m128i vindex, const int scale);

extern __m256 _mm256_mask_i32gather_ps(float const * base, __m256i vindex, const int scale);

引数

base

ロードされる浮動小数点要素の参照に使用するベースアドレス

vindex

ロードされる浮動小数点要素の参照に使用するダブルワード・インデックスのベクトル

scale

コンパイル時のリテラル定数。ロードされる要素のアドレスを指定するベクトル・インデックス・スケールとして使用されます。次のいずれかの値を指定してください: 1、2、4、8。

説明

ダブルワードのインデックスを使用して、メモリーから 2 つまたは 4 つのパックド単精度浮動小数点値をロードします。

以下にこの組込み関数の擬似コードを示します。

_mm_i32gather_ps():

result[31:0] = mem[base+vindex[31:0]*scale];
result[63:32] = mem[base+vindex[63:32]*scale];
result[95:64] = mem[base+vindex[95:64]*scale];
result127:96] = mem[base+vindex[127:96]*scale];

_mm256_i32gather_ps():

result[31:0] = mem[base+vindex[31:0]*scale];
result[63:32] = mem[base+vindex[63:32]*scale];
result[95:64] = mem[base+vindex[95:64]*scale];
result127:96] = mem[base+vindex[127:96]*scale];
result[159:128] = mem[base+vindex[159:128]*scale];
result[191:160] = mem[base+vindex[191:160]*scale];
result[223:192] = mem[base+vindex[223:192]*scale];
result[255:224] = mem[base+vindex[255:224]*scale];

戻り値

単精度浮動小数点値を無条件で集約した 128/256 ビットのベクトル。