インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス

整数置換操作の組込み関数

インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 組込み関数のプロトタイプは、zmmintrin.h ヘッダーファイルで定義されていますが、実際にヘッダーをコードにインクルードする場合は、immintrin.h を使用します。


組込み関数名

演算

対応するインテル® AVX-512 命令

_mm512_permutex2var_epi32_mm512_mask_permutex2var_epi32_mm512_mask2_permutex2var_epi32_mm512_maskz_permutex2var_epi32

int32 要素を複数のレーンにわたってシャッフルします。

VPERMI2D

_mm512_permutex2var_epi64_mm512_mask_permutex2var_epi64_mm512_mask2_permutex2var_epi64_mm512_maskz_permutex2var_epi64

int64 要素を複数のレーンにわたってシャッフルします。

VPERMI2QVPERMT2Q

_mm512_permutevar_epi32_mm512_mask_permutevar_epi32

_mm512_permutexvar_epi32_mm512_mask_permutexvar_epi32_mm512_maskz_permutexvar_epi32

int32 要素を複数のレーンにわたってシャッフルします。

VPERMD

_mm512_permutex_epi64_mm512_mask_permutex_epi64_mm512_maskz_permutex_epi64

_mm512_permutexvar_epi64_mm512_mask_permutexvar_epi64_mm512_maskz_permutexvar_epi64

int64 要素を複数のレーンにわたってシャッフルします。

VPERMQ


変数 定義
k

セレクターとして使用される書き込みマスク

a

1 つ目のソースベクトルの要素

src

書き込みマスクの結果に応じて使用されるソース要素

idx

メモリーにあるインデックスを含む int32 ベクトル


_mm512_permutevar_epi32

extern __m512i __cdecl _mm512_permutevar_epi32(__m512i a, __m512i idx);

idx の対応するインデックスを使用して、a の int32 要素を複数のレーンにわたってシャッフルし、結果を格納します。

これまでの permutevar 組込み関数と異なり、この組込み関数は 128 ビット・レーンにわたってシャッフルします。この組込み関数は _mm512_mask_permutexvar_epi32 と同じです。_mm512_mask_permutexvar_epi32 を使用することを推奨します。


_mm512_mask_permutevar_epi32

extern __m512i __cdecl _mm512_mask_permutevar_epi32(__m512i src, __mmask16 k, __m512i a, __m512i idx);

idx の対応するインデックスを使用して、a の int32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。

これまでの permutevar 組込み関数と異なり、この組込み関数は 128 ビット・レーンにわたってシャッフルします。この組込み関数は _mm512_mask_permutexvar_epi32 と同じです。_mm512_mask_permutexvar_epi32 を使用することを推奨します。



_mm512_permutexvar_epi32

extern __m512i __cdecl _mm512_permutexvar_epi32(__m512i idx, __m512i a);

idx の対応するインデックスを使用して、a の int32 要素を複数のレーンにわたってシャッフルし、結果を格納します。


_mm512_mask_permutexvar_epi32

extern __m512i __cdecl _mm512_mask_permutexvar_epi32(__m512i src, __mmask16 k, __m512i idx, __m512i a);

idx の対応するインデックスを使用して、a の int32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。


_mm512_maskz_permutexvar_epi32

extern __m512i __cdecl _mm512_maskz_permutexvar_epi32(__mmask16 k, __m512i idx, __m512i a);

idx の対応するインデックスを使用して、a の int32 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。



_mm512_permutex2var_epi32

extern __m512i __cdecl _mm512_permutex2var_epi32(__m512i a, __m512i idx, __m512i b);

idx の対応するセレクターとインデックスを使用して、ab の int32 要素を複数のレーンにわたってシャッフルし、結果を格納します。


_mm512_mask_permutex2var_epi32

extern __m512i __cdecl _mm512_mask_permutex2var_epi32(__m512i a, __mmask16 k, __m512i idx, __m512i b);

idx の対応するセレクターとインデックスを使用して、ab の int32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は a の要素がコピーされます)。


_mm512_mask2_permutex2var_epi32

extern __m512i __cdecl _mm512_mask2_permutex2var_epi32(__m512i a, __m512i idx, __mmask16 k, __m512i b);

idx の対応するセレクターとインデックスを使用して、ab の int32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は idx の要素がコピーされます)。



_mm512_maskz_permutex2var_epi32

extern __m512i __cdecl _mm512_maskz_permutex2var_epi32(__mmask16 k, __m512i a, __m512i idx, __m512i b);

idx の対応するセレクターとインデックスを使用して、ab の int32 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。




_mm512_permutex2var_epi64

extern __m512i __cdecl _mm512_permutex2var_epi64(__m512i a, __m512i idx, __m512i b);

idx の対応するセレクターとインデックスを使用して、ab の int64 要素を複数のレーンにわたってシャッフルし、結果を格納します。


_mm512_mask_permutex2var_epi64

extern __m512i __cdecl _mm512_mask_permutex2var_epi64(__m512i a, __mmask8 k, __m512i idx, __m512i b);

idx の対応するセレクターとインデックスを使用して、ab の int64 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は a の要素がコピーされます)。


_mm512_mask2_permutex2var_epi64

extern __m512i __cdecl _mm512_mask2_permutex2var_epi64(__m512i a, __m512i idx, __mmask8 k, __m512i b);

idx の対応するセレクターとインデックスを使用して、ab の int64 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は idx の要素がコピーされます)。


_mm512_maskz_permutex2var_epi64

extern __m512i __cdecl _mm512_maskz_permutex2var_epi64(__mmask8 k, __m512i a, __m512i idx, __m512i b);

idx の対応するセレクターとインデックスを使用して、ab の int64 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。



_mm512_permutex_epi64

extern __m512i __cdecl _mm512_permutex_epi64(__m512i a, const int imm);

imm のコントロールを使用して、a の int64 要素を 256 ビット・レーン内でシャッフルし、結果を格納します。


_mm512_mask_permutex_epi64

extern __m512i __cdecl _mm512_mask_permutex_epi64(__m512i src, __mmask8 k, __m512i a, const int imm);

imm のコントロールを使用して、a の int64 要素を 256 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。


_mm512_maskz_permutex_epi64

extern __m512i __cdecl _mm512_maskz_permutex_epi64(__mmask8 k, __m512i a, const int imm);

imm のコントロールを使用して、a の int64 要素を 256 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。



_mm512_permutexvar_epi64

extern __m512i __cdecl _mm512_permutexvar_epi64(__m512i a, __m512i idx);

idx の対応するインデックスを使用して、a の int64 要素を複数のレーンにわたってシャッフルし、結果を格納します。


_mm512_mask_permutexvar_epi64

extern __m512i __cdecl _mm512_mask_permutexvar_epi64(__m512i src, __mmask8 k, __m512i a, __m512i idx);

idx の対応するインデックスを使用して、a の int64 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。


_mm512_maskz_permutexvar_epi64

extern __m512i __cdecl _mm512_maskz_permutexvar_epi64(__mmask8 k, __m512i a, __m512i idx);

idx の対応するインデックスを使用して、a の int64 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。