インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス

FP シャッフル操作の組込み関数

インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 組込み関数のプロトタイプは、zmmintrin.h ヘッダーファイルで定義されていますが、実際にヘッダーをコードにインクルードする場合は、immintrin.h を使用します。


組込み関数名

演算

対応するインテル® AVX-512 命令

_mm512_shuffle_pd_mm512_mask_shuffle_pd_mm512_maskz_shuffle_pd

float64 値をシャッフルします。

VSHUFPD

_mm512_shuffle_ps_mm512_mask_shuffle_ps_mm512_maskz_shuffle_ps

float32 値をシャッフルします。

VSHUFPS

_mm512_shuffle_f64x2_mm512_mask_shuffle_f64x2_mm512_maskz_shuffle_f64x2

float64 をシャッフルし、マスクを使用して結果を格納します。

VSHUFF64X2

_mm512_shuffle_f32x4_mm512_mask_shuffle_f32x4_mm512_maskz_shuffle_f32x4

float32 をシャッフルし、マスクを使用して結果を格納します。

VSHUFF32X4


変数 定義
k

セレクターとして使用される書き込みマスク

a

1 つ目のソースベクトルの要素

b

2 つ目のソースベクトルの要素

src

書き込みマスクの結果に応じて使用されるソース要素

imm

ベクトル要素のセレクター


_mm512_shuffle_f32x4

extern __m512 __cdecl _mm512_shuffle_f32x4(__m512 a, __m512 b, const int imm);

imm で選択された ab の 4 つの float32 要素をシャッフルし、結果を格納します。


_mm512_mask_shuffle_f32x4

extern __m512 __cdecl _mm512_mask_shuffle_f32x4(__m512 src, __mmask16 k, __m512 a, __m512 b, const int imm);

imm で選択された ab の 4 つの float32 要素をシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。


_mm512_maskz_shuffle_f32x4

extern __m512 __cdecl _mm512_maskz_shuffle_f32x4(__mmask16 k, __m512 a, __m512 b, const int imm);

imm で選択された ab の 4 つの float32 要素をシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。



_mm512_shuffle_f64x2

extern __m512d __cdecl _mm512_shuffle_f64x2(__m512d a, __m512d b, const int imm);

imm で選択された ab の 128 ビット (2 つの float64 要素) をシャッフルし、結果を格納します。


_mm512_mask_shuffle_f64x2

extern __m512d __cdecl _mm512_mask_shuffle_f64x2(__m512d src, __mmask8 k, __m512d a, __m512d b, const int imm);

imm で選択された ab の 128 ビット (2 つの float64 要素) をシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。


_mm512_maskz_shuffle_f64x2

extern __m512d __cdecl _mm512_maskz_shuffle_f64x2(__mmask8 k, __m512d a, __m512d b, const int imm);

imm で選択された ab の 128 ビット (2 つの float64 要素) をシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。



_mm512_shuffle_pd

extern __m512d __cdecl _mm512_shuffle_pd(__m512d a, __m512d b, const int imm);

imm のコントロールを使用して、ベクトル ab の float64 要素を 128 ビット・レーン内でシャッフルし、結果を格納します。


_mm512_mask_shuffle_pd

extern __m512d __cdecl _mm512_mask_shuffle_pd(__m512d src, __mmask8 k, __m512d a, __m512d b, const int imm);

imm のコントロールを使用して、ベクトル ab の float64 要素を 128 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。


_mm512_maskz_shuffle_pd

extern __m512d __cdecl _mm512_maskz_shuffle_pd(__mmask8 k, __m512d a, __m512d b, const int imm);

imm のコントロールを使用して、ベクトル ab の float64 要素を 128 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。



_mm512_shuffle_ps

extern __m512 __cdecl _mm512_shuffle_ps(__m512 a, __m512 b, const int imm);

imm のコントロールを使用して、ベクトル ab の float32 要素を 128 ビット・レーン内でシャッフルし、結果を格納します。


_mm512_mask_shuffle_ps

extern __m512 __cdecl _mm512_mask_shuffle_ps(__m512 src, __mmask16 k, __m512 a, __m512 b, const int imm);

imm のコントロールを使用して、ベクトル ab の float32 要素を 128 ビット・レーン内でシャッフルし、書き込みマスク k を使用して結果を格納します。

マスクの対応するビットが設定されていない場合は src の要素がコピーされます。


_mm512_maskz_shuffle_ps

extern __m512 __cdecl _mm512_maskz_shuffle_ps(__mmask16 k, __m512 a, __m512 b, const int imm);

imm のコントロールを使用して、ベクトル ab の float32 要素を 128 ビット・レーン内でシャッフルし、ゼロマスク k を使用して結果を格納します。

マスクの対応するビットが設定されていない場合は要素が 0 に設定されます。