インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 組込み関数のプロトタイプは、zmmintrin.h ヘッダーファイルで定義されていますが、実際にヘッダーをコードにインクルードする場合は、immintrin.h を使用します。
組込み関数名 |
演算 |
対応するインテル® AVX-512 命令 |
---|---|---|
_mm512_shuffle_pd、 _mm512_mask_shuffle_pd、 _mm512_maskz_shuffle_pd |
float64 値をシャッフルします。 |
VSHUFPD |
_mm512_shuffle_ps、 _mm512_mask_shuffle_ps、 _mm512_maskz_shuffle_ps |
float32 値をシャッフルします。 |
VSHUFPS |
_mm512_shuffle_f64x2、 _mm512_mask_shuffle_f64x2、 _mm512_maskz_shuffle_f64x2 |
float64 をシャッフルし、マスクを使用して結果を格納します。 |
VSHUFF64X2 |
_mm512_shuffle_f32x4、 _mm512_mask_shuffle_f32x4、 _mm512_maskz_shuffle_f32x4 |
float32 をシャッフルし、マスクを使用して結果を格納します。 |
VSHUFF32X4 |
変数 | 定義 |
---|---|
k | セレクターとして使用される書き込みマスク |
a | 1 つ目のソースベクトルの要素 |
b | 2 つ目のソースベクトルの要素 |
src | 書き込みマスクの結果に応じて使用されるソース要素 |
imm | ベクトル要素のセレクター |
_mm512_shuffle_f32x4
extern __m512 __cdecl _mm512_shuffle_f32x4(__m512 a, __m512 b, const int imm);
imm で選択された a と b の 4 つの float32 要素をシャッフルし、結果を格納します。
_mm512_mask_shuffle_f32x4
extern __m512 __cdecl _mm512_mask_shuffle_f32x4(__m512 src, __mmask16 k, __m512 a, __m512 b, const int imm);
imm で選択された a と b の 4 つの float32 要素をシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_shuffle_f32x4
extern __m512 __cdecl _mm512_maskz_shuffle_f32x4(__mmask16 k, __m512 a, __m512 b, const int imm);
imm で選択された a と b の 4 つの float32 要素をシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_shuffle_f64x2
extern __m512d __cdecl _mm512_shuffle_f64x2(__m512d a, __m512d b, const int imm);
imm で選択された a と b の 128 ビット (2 つの float64 要素) をシャッフルし、結果を格納します。
_mm512_mask_shuffle_f64x2
extern __m512d __cdecl _mm512_mask_shuffle_f64x2(__m512d src, __mmask8 k, __m512d a, __m512d b, const int imm);
imm で選択された a と b の 128 ビット (2 つの float64 要素) をシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_shuffle_f64x2
extern __m512d __cdecl _mm512_maskz_shuffle_f64x2(__mmask8 k, __m512d a, __m512d b, const int imm);
imm で選択された a と b の 128 ビット (2 つの float64 要素) をシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_shuffle_pd
extern __m512d __cdecl _mm512_shuffle_pd(__m512d a, __m512d b, const int imm);
imm のコントロールを使用して、ベクトル a と b の float64 要素を 128 ビット・レーン内でシャッフルし、結果を格納します。
_mm512_mask_shuffle_pd
extern __m512d __cdecl _mm512_mask_shuffle_pd(__m512d src, __mmask8 k, __m512d a, __m512d b, const int imm);
imm のコントロールを使用して、ベクトル a と b の float64 要素を 128 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_shuffle_pd
extern __m512d __cdecl _mm512_maskz_shuffle_pd(__mmask8 k, __m512d a, __m512d b, const int imm);
imm のコントロールを使用して、ベクトル a と b の float64 要素を 128 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_shuffle_ps
extern __m512 __cdecl _mm512_shuffle_ps(__m512 a, __m512 b, const int imm);
imm のコントロールを使用して、ベクトル a と b の float32 要素を 128 ビット・レーン内でシャッフルし、結果を格納します。
_mm512_mask_shuffle_ps
extern __m512 __cdecl _mm512_mask_shuffle_ps(__m512 src, __mmask16 k, __m512 a, __m512 b, const int imm);
imm のコントロールを使用して、ベクトル a と b の float32 要素を 128 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します。
マスクの対応するビットが設定されていない場合は src の要素がコピーされます。
_mm512_maskz_shuffle_ps
extern __m512 __cdecl _mm512_maskz_shuffle_ps(__mmask16 k, __m512 a, __m512 b, const int imm);
imm のコントロールを使用して、ベクトル a と b の float32 要素を 128 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します。
マスクの対応するビットが設定されていない場合は要素が 0 に設定されます。