インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス
指定されたベースアドレス、ダブルワードのインデックス、およびスケールによるメモリー参照から 2 つまたは 4 つのダブルワード値を集約 (Gather) します。対応するインテル® AVX2 命令は VPGATHERDD です。
extern __m128i _mm_i32gather_epi32(int const * base, __m128i vindex, const int scale); |
extern __m256i _mm256_i32gather_epi32(int const * base, __m256i vindex, const int scale); |
base |
ロードされるダブルワード要素の参照に使用するベースアドレス |
vindex |
ロードされるダブルワード要素の参照に使用するダブルワード・インデックスのベクトル |
scale |
ロードされるダブルワード要素の参照に使用する 32 ビットのスケール。'vindex' の対応する要素が掛けられます。 |
ベースアドレス、クワッドワードのインデックス、および 32 ビットのスケールを使用して、メモリーから 2 つまたは 4 つのダブルワード値をロードします。
以下にこの組込み関数の擬似コードを示します。
_mm_i32gather_epi32():
result[31:0] = mem[base+vindex[31:0]*scale]; result[63:32] = mem[base+vindex[63:32]*scale]; result[95:64] = mem[base+vindex[95:64]*scale]; result127:96] = mem[base+vindex[127:96]*scale];
_mm256_i32gather_epi32():
result[31:0] = mem[base+vindex[31:0]*scale]; result[63:32] = mem[base+vindex[63:32]*scale]; result[95:64] = mem[base+vindex[95:64]*scale]; result127:96] = mem[base+vindex[127:96]*scale]; result[159:128] = mem[base+vindex[159:128]*scale]; result[191:160] = mem[base+vindex[191:160]*scale]; result[223:192] = mem[base+vindex[223:192]*scale]; result[255:224] = mem[base+vindex[255:224]*scale];
integer32 値を無条件で集約した 128/256 ビットのベクトル。