インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 組込み関数のプロトタイプは、zmmintrin.h ヘッダーファイルで定義されていますが、実際にヘッダーをコードにインクルードする場合は、immintrin.h を使用します。
組込み関数名 |
演算 |
対応するインテル® AVX-512 命令 |
---|---|---|
_mm512_permutex2var_epi32、 _mm512_mask_permutex2var_epi32、 _mm512_mask2_permutex2var_epi32、 _mm512_maskz_permutex2var_epi32 |
int32 要素を複数のレーンにわたってシャッフルします。 |
VPERMI2D |
_mm512_permutex2var_epi64、 _mm512_mask_permutex2var_epi64、 _mm512_mask2_permutex2var_epi64、 _mm512_maskz_permutex2var_epi64 |
int64 要素を複数のレーンにわたってシャッフルします。 |
VPERMI2Q、 VPERMT2Q |
_mm512_permutevar_epi32、 _mm512_mask_permutevar_epi32 _mm512_permutexvar_epi32、 _mm512_mask_permutexvar_epi32、 _mm512_maskz_permutexvar_epi32 |
int32 要素を複数のレーンにわたってシャッフルします。 |
VPERMD |
_mm512_permutex_epi64、 _mm512_mask_permutex_epi64、 _mm512_maskz_permutex_epi64 _mm512_permutexvar_epi64、 _mm512_mask_permutexvar_epi64、 _mm512_maskz_permutexvar_epi64 |
int64 要素を複数のレーンにわたってシャッフルします。 |
VPERMQ |
変数 | 定義 |
---|---|
k | セレクターとして使用される書き込みマスク |
a | 1 つ目のソースベクトルの要素 |
src | 書き込みマスクの結果に応じて使用されるソース要素 |
idx | メモリーにあるインデックスを含む int32 ベクトル |
_mm512_permutevar_epi32
extern __m512i __cdecl _mm512_permutevar_epi32(__m512i a, __m512i idx);
idx の対応するインデックスを使用して、a の int32 要素を複数のレーンにわたってシャッフルし、結果を格納します。
これまでの permutevar 組込み関数と異なり、この組込み関数は 128 ビット・レーンにわたってシャッフルします。この組込み関数は _mm512_mask_permutexvar_epi32 と同じです。_mm512_mask_permutexvar_epi32 を使用することを推奨します。
_mm512_mask_permutevar_epi32
extern __m512i __cdecl _mm512_mask_permutevar_epi32(__m512i src, __mmask16 k, __m512i a, __m512i idx);
idx の対応するインデックスを使用して、a の int32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
これまでの permutevar 組込み関数と異なり、この組込み関数は 128 ビット・レーンにわたってシャッフルします。この組込み関数は _mm512_mask_permutexvar_epi32 と同じです。_mm512_mask_permutexvar_epi32 を使用することを推奨します。
_mm512_permutexvar_epi32
extern __m512i __cdecl _mm512_permutexvar_epi32(__m512i idx, __m512i a);
idx の対応するインデックスを使用して、a の int32 要素を複数のレーンにわたってシャッフルし、結果を格納します。
_mm512_mask_permutexvar_epi32
extern __m512i __cdecl _mm512_mask_permutexvar_epi32(__m512i src, __mmask16 k, __m512i idx, __m512i a);
idx の対応するインデックスを使用して、a の int32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_permutexvar_epi32
extern __m512i __cdecl _mm512_maskz_permutexvar_epi32(__mmask16 k, __m512i idx, __m512i a);
idx の対応するインデックスを使用して、a の int32 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permutex2var_epi32
extern __m512i __cdecl _mm512_permutex2var_epi32(__m512i a, __m512i idx, __m512i b);
idx の対応するセレクターとインデックスを使用して、a と b の int32 要素を複数のレーンにわたってシャッフルし、結果を格納します。
_mm512_mask_permutex2var_epi32
extern __m512i __cdecl _mm512_mask_permutex2var_epi32(__m512i a, __mmask16 k, __m512i idx, __m512i b);
idx の対応するセレクターとインデックスを使用して、a と b の int32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は a の要素がコピーされます)。
_mm512_mask2_permutex2var_epi32
extern __m512i __cdecl _mm512_mask2_permutex2var_epi32(__m512i a, __m512i idx, __mmask16 k, __m512i b);
idx の対応するセレクターとインデックスを使用して、a と b の int32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は idx の要素がコピーされます)。
_mm512_maskz_permutex2var_epi32
extern __m512i __cdecl _mm512_maskz_permutex2var_epi32(__mmask16 k, __m512i a, __m512i idx, __m512i b);
idx の対応するセレクターとインデックスを使用して、a と b の int32 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permutex2var_epi64
extern __m512i __cdecl _mm512_permutex2var_epi64(__m512i a, __m512i idx, __m512i b);
idx の対応するセレクターとインデックスを使用して、a と b の int64 要素を複数のレーンにわたってシャッフルし、結果を格納します。
_mm512_mask_permutex2var_epi64
extern __m512i __cdecl _mm512_mask_permutex2var_epi64(__m512i a, __mmask8 k, __m512i idx, __m512i b);
idx の対応するセレクターとインデックスを使用して、a と b の int64 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は a の要素がコピーされます)。
_mm512_mask2_permutex2var_epi64
extern __m512i __cdecl _mm512_mask2_permutex2var_epi64(__m512i a, __m512i idx, __mmask8 k, __m512i b);
idx の対応するセレクターとインデックスを使用して、a と b の int64 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は idx の要素がコピーされます)。
_mm512_maskz_permutex2var_epi64
extern __m512i __cdecl _mm512_maskz_permutex2var_epi64(__mmask8 k, __m512i a, __m512i idx, __m512i b);
idx の対応するセレクターとインデックスを使用して、a と b の int64 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permutex_epi64
extern __m512i __cdecl _mm512_permutex_epi64(__m512i a, const int imm);
imm のコントロールを使用して、a の int64 要素を 256 ビット・レーン内でシャッフルし、結果を格納します。
_mm512_mask_permutex_epi64
extern __m512i __cdecl _mm512_mask_permutex_epi64(__m512i src, __mmask8 k, __m512i a, const int imm);
imm のコントロールを使用して、a の int64 要素を 256 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_permutex_epi64
extern __m512i __cdecl _mm512_maskz_permutex_epi64(__mmask8 k, __m512i a, const int imm);
imm のコントロールを使用して、a の int64 要素を 256 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permutexvar_epi64
extern __m512i __cdecl _mm512_permutexvar_epi64(__m512i a, __m512i idx);
idx の対応するインデックスを使用して、a の int64 要素を複数のレーンにわたってシャッフルし、結果を格納します。
_mm512_mask_permutexvar_epi64
extern __m512i __cdecl _mm512_mask_permutexvar_epi64(__m512i src, __mmask8 k, __m512i a, __m512i idx);
idx の対応するインデックスを使用して、a の int64 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_permutexvar_epi64
extern __m512i __cdecl _mm512_maskz_permutexvar_epi64(__mmask8 k, __m512i a, __m512i idx);
idx の対応するインデックスを使用して、a の int64 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。