インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 組込み関数のプロトタイプは、zmmintrin.h ヘッダーファイルで定義されていますが、実際にヘッダーをコードにインクルードする場合は、immintrin.h を使用します。
組込み関数名 |
演算 |
対応するインテル® AVX-512 命令 |
---|---|---|
_mm512_permutex2var_pd、 _mm512_mask_permutex2var_pd、 _mm512_mask2_permutex2var_pd、 _mm512_maskz_permutex2var_pd |
float64 要素を複数のレーンにわたってシャッフルします。 |
VPERMI2PD |
_mm512_permutex2var_ps、 _mm512_mask_permutex2var_ps、 _mm512_mask2_permutex2var_ps、 _mm512_maskz_permutex2var_ps |
float32 要素を複数のレーンにわたってシャッフルします。 |
VPERMI2PS |
_mm512_permute_pd、 _mm512_mask_permute_pd、 _mm512_maskz_permute_pd |
float64 要素を 128 ビット・レーン内でシャッフルします。 |
VPERMILPD、 VPERMPD |
_mm512_permutevar_pd、 _mm512_mask_permutevar_pd、 _mm512_maskz_permutevar_pd |
float64 要素を 128 ビット・レーン内でシャッフルします。 |
VPERMPD |
_mm512_permutex_pd、 _mm512_mask_permutex_pd、 _mm512_maskz_permutex_pd |
float64 要素を複数のレーン内でシャッフルします。 |
VPERMPD |
_mm512_permutexvar_pd、 _mm512_mask_permutexvar_pd、 _mm512_maskz_permutexvar_pd |
float64 要素を複数のレーンにわたってシャッフルします。 |
VPERMPD |
_mm512_permute_ps、 _mm512_mask_permute_ps、 _mm512_maskz_permute_ps |
float32 要素を複数のレーン内でシャッフルします。 |
VPERMILPS |
_mm512_permutevar_ps、 _mm512_mask_permutevar_ps、 _mm512_maskz_permutevar_ps |
float32 要素を複数のレーン内でシャッフルします。 |
VPERMPS、 VPERMILPS |
_mm512_permutexvar_ps、 _mm512_mask_permutexvar_ps、 _mm512_maskz_permutexvar_ps |
float32 要素を複数のレーンにわたってシャッフルします。 |
VPERMPS |
変数 | 定義 |
---|---|
k | セレクターとして使用される書き込みマスク |
a | 1 つ目のソースベクトルの要素 |
b | 2 つ目のソースベクトルの要素 |
src | 書き込みマスクの結果に応じて使用されるソース要素 |
idx | インデックス |
_mm512_permutex2var_pd
extern __m512d __cdecl _mm512_permutex2var_pd(__m512d a, __m512i idx, __m512d b);
idx の対応するセレクターとインデックスを使用して、a と b の float64 要素を複数のレーンにわたってシャッフルし、結果を格納します。
_mm512_mask_permutex2var_pd
extern __m512d __cdecl _mm512_mask_permutex2var_pd(__m512d a, __mmask8 k, __m512i idx, __m512d b);
idx の対応するセレクターとインデックスを使用して、a と b の float64 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は a の要素がコピーされます)。
_mm512_mask2_permutex2var_pd
extern __m512d __cdecl _mm512_mask2_permutex2var_pd(__m512d a, __m512i idx, __mmask8 k, __m512d b);
idx の対応するセレクターとインデックスを使用して、a と b の float64 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は idx の要素がコピーされます)。
_mm512_maskz_permutex2var_pd
extern __m512d __cdecl _mm512_maskz_permutex2var_pd(__mmask8 k, __m512d a, __m512i idx, __m512d b);
idx の対応するセレクターとインデックスを使用して、a と b の float64 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permutex2var_ps
extern __m512 __cdecl _mm512_permutex2var_ps(__m512 a, __m512i idx, __m512 b);
idx の対応するセレクターとインデックスを使用して、a と b の float32 要素を複数のレーンにわたってシャッフルし、結果を格納します。
_mm512_mask2_permutex2var_ps
extern __m512 __cdecl _mm512_mask_permutex2var_ps(__m512 a, __mmask16 k, __m512i idx, __m512 b);
idx の対応するセレクターとインデックスを使用して、a と b の float32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は idx の要素がコピーされます)。
_mm512_mask_permutex2var_ps
extern __m512 __cdecl _mm512_mask2_permutex2var_ps(__m512 a, __m512i idx, __mmask16 k, __m512 b);
idx の対応するセレクターとインデックスを使用して、a と b の float32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は a の要素がコピーされます)。
_mm512_maskz_permutex2var_ps
extern __m512 __cdecl _mm512_maskz_permutex2var_ps(__mmask16 k, __m512 a, __m512i idx, __m512 b);
idx の対応するセレクターとインデックスを使用して、a と b の float32 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permute_pd
extern __m512d __cdecl _mm512_permute_pd(__m512d a, const int imm);
imm のコントロールを使用して、a の float64 要素を 128 ビット・レーン内でシャッフルし、結果を格納します。
_mm512_mask_permute_pd
extern __m512d __cdecl _mm512_mask_permute_pd(__m512d src, __mmask8 k, __m512d a, const int imm);
imm のコントロールを使用して、a の float64 要素を 128 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_permute_pd
extern __m512d __cdecl _mm512_maskz_permute_pd(__mmask8 k, __m512d a, const int imm);
imm のコントロールを使用して、a の float64 要素を 128 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permutevar_pd
extern __m512d __cdecl _mm512_permutevar_pd(__m512d a, __m512i b);
b のコントロールを使用して、a の float64 要素を 128 ビット・レーン内でシャッフルし、結果を格納します。
_mm512_mask_permutevar_pd
extern __m512d __cdecl _mm512_mask_permutevar_pd(__m512d src, __mmask8 k, __m512d a, __m512i b);
b のコントロールを使用して、a の float64 要素を 128 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_permutevar_pd
extern __m512d __cdecl _mm512_maskz_permutevar_pd(__mmask8 k, __m512d a, __m512i b);
b のコントロールを使用して、a の float64 要素を 128 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permute_ps
extern __m512 __cdecl _mm512_permute_ps(__m512 a, const int imm);
imm のコントロールを使用して、a の float32 要素を 128 ビット・レーン内でシャッフルし、結果を格納します。
_mm512_mask_permute_ps
extern __m512 __cdecl _mm512_mask_permute_ps(__m512 src, __mmask16 k, __m512 a, const int imm);
imm のコントロールを使用して、a の float32 要素を 128 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_permute_ps
extern __m512 __cdecl _mm512_maskz_permute_ps(__mmask16 k, __m512 a, const int imm);
imm のコントロールを使用して、a の float32 要素を 128 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permutevar_ps
extern __m512 __cdecl _mm512_permutevar_ps(__m512 a, __m512i b);
b のコントロールを使用して、a の float32 要素を 128 ビット・レーン内でシャッフルし、結果を格納します。
_mm512_mask_permutevar_ps
extern __m512 __cdecl _mm512_mask_permutevar_ps(__m512 src, __mmask16 k, __m512 a, __m512i b);
b のコントロールを使用して、a の float32 要素を 128 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_permutevar_ps
extern __m512 __cdecl _mm512_maskz_permutevar_ps(__mmask16 k, __m512 a, __m512i b);
b のコントロールを使用して、a の float32 要素を 128 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permutex_pd
extern __m512d __cdecl _mm512_permutex_pd(__m512d a, const int imm);
imm のコントロールを使用して、a の float64 要素を 256 ビット・レーン内でシャッフルし、結果を格納します。
_mm512_mask_permutex_pd
extern __m512d __cdecl _mm512_mask_permutex_pd(__m512d src, __mmask8 k, __m512d a, const int imm);
imm のコントロールを使用して、a の float64 要素を 256 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_permutex_pd
extern __m512d __cdecl _mm512_maskz_permutex_pd(__mmask8 k, __m512d a, const int imm);
imm のコントロールを使用して、a の float64 要素を 256 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permutexvar_pd
extern __m512d __cdecl _mm512_permutexvar_pd(__m512i idx, __m512d a);
idx の対応するインデックスを使用して、a の float64 要素を複数のレーンにわたってシャッフルし、結果を格納します。
_mm512_mask_permutexvar_pd
extern __m512d __cdecl _mm512_mask_permutexvar_pd(__m512d src, __mmask8 k, __m512i idx, __m512d a);
idx の対応するインデックスを使用して、a の float64 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_permutexvar_pd
extern __m512d __cdecl _mm512_maskz_permutexvar_pd(__mmask8 k, __m512i idx, __m512d a);
idx の対応するインデックスを使用して、a の float64 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_permutexvar_ps
extern __m512 __cdecl _mm512_permutexvar_ps(__m512i idx, __m512 a);
idx の対応するインデックスを使用して、a の float32 要素を複数のレーンにわたってシャッフルし、結果を格納します。
_mm512_mask_permutexvar_ps
extern __m512 __cdecl _mm512_mask_permutexvar_ps(__m512 src, __mmask16 k, __m512i idx, __m512 a);
idx の対応するインデックスを使用して、a の float32 要素を複数のレーンにわたってシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_permutexvar_ps
extern __m512 __cdecl _mm512_maskz_permutexvar_ps(__mmask16 k, __m512i idx, __m512 a);
idx の対応するインデックスを使用して、a の float32 要素を複数のレーンにわたってシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。