FP シャッフル操作の組込み関数

インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス

インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 組込み関数のプロトタイプは、zmmintrin.h ヘッダーファイルで定義されていますが、実際にヘッダーをコードにインクルードする場合は、immintrin.h を使用します。

組込み関数名	演算	対応するインテル® AVX-512 命令
`_mm512_shuffle_pd`、 `_mm512_mask_shuffle_pd`、 `_mm512_maskz_shuffle_pd`	float64 値をシャッフルします。	`VSHUFPD`
`_mm512_shuffle_ps`、 `_mm512_mask_shuffle_ps`、 `_mm512_maskz_shuffle_ps`	float32 値をシャッフルします。	`VSHUFPS`
`_mm512_shuffle_f64x2`、 `_mm512_mask_shuffle_f64x2`、 `_mm512_maskz_shuffle_f64x2`	float64 をシャッフルし、マスクを使用して結果を格納します。	`VSHUFF64X2`
`_mm512_shuffle_f32x4`、 `_mm512_mask_shuffle_f32x4`、 `_mm512_maskz_shuffle_f32x4`	float32 をシャッフルし、マスクを使用して結果を格納します。	`VSHUFF32X4`

_mm512_shuffle_f32x4

extern __m512 __cdecl _mm512_shuffle_f32x4(__m512 a, __m512 b, const int imm);

imm で選択された a と b の 4 つの float32 要素をシャッフルし、結果を格納します。

_mm512_mask_shuffle_f32x4

extern __m512 __cdecl _mm512_mask_shuffle_f32x4(__m512 src, __mmask16 k, __m512 a, __m512 b, const int imm);

imm で選択された a と b の 4 つの float32 要素をシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。

_mm512_maskz_shuffle_f32x4

extern __m512 __cdecl _mm512_maskz_shuffle_f32x4(__mmask16 k, __m512 a, __m512 b, const int imm);

imm で選択された a と b の 4 つの float32 要素をシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。

_mm512_shuffle_f64x2

extern __m512d __cdecl _mm512_shuffle_f64x2(__m512d a, __m512d b, const int imm);

imm で選択された a と b の 128 ビット (2 つの float64 要素) をシャッフルし、結果を格納します。

_mm512_mask_shuffle_f64x2

extern __m512d __cdecl _mm512_mask_shuffle_f64x2(__m512d src, __mmask8 k, __m512d a, __m512d b, const int imm);

imm で選択された a と b の 128 ビット (2 つの float64 要素) をシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。

_mm512_maskz_shuffle_f64x2

extern __m512d __cdecl _mm512_maskz_shuffle_f64x2(__mmask8 k, __m512d a, __m512d b, const int imm);

imm で選択された a と b の 128 ビット (2 つの float64 要素) をシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。

_mm512_shuffle_pd

extern __m512d __cdecl _mm512_shuffle_pd(__m512d a, __m512d b, const int imm);

imm のコントロールを使用して、ベクトル a と b の float64 要素を 128 ビット・レーン内でシャッフルし、結果を格納します。

_mm512_mask_shuffle_pd

extern __m512d __cdecl _mm512_mask_shuffle_pd(__m512d src, __mmask8 k, __m512d a, __m512d b, const int imm);

imm のコントロールを使用して、ベクトル a と b の float64 要素を 128 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。

_mm512_maskz_shuffle_pd

extern __m512d __cdecl _mm512_maskz_shuffle_pd(__mmask8 k, __m512d a, __m512d b, const int imm);

imm のコントロールを使用して、ベクトル a と b の float64 要素を 128 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。

_mm512_shuffle_ps

extern __m512 __cdecl _mm512_shuffle_ps(__m512 a, __m512 b, const int imm);

imm のコントロールを使用して、ベクトル a と b の float32 要素を 128 ビット・レーン内でシャッフルし、結果を格納します。

_mm512_mask_shuffle_ps

extern __m512 __cdecl _mm512_mask_shuffle_ps(__m512 src, __mmask16 k, __m512 a, __m512 b, const int imm);

imm のコントロールを使用して、ベクトル a と b の float32 要素を 128 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します。

マスクの対応するビットが設定されていない場合は src の要素がコピーされます。

_mm512_maskz_shuffle_ps

extern __m512 __cdecl _mm512_maskz_shuffle_ps(__mmask16 k, __m512 a, __m512 b, const int imm);

imm のコントロールを使用して、ベクトル a と b の float32 要素を 128 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します。

マスクの対応するビットが設定されていない場合は要素が 0 に設定されます。