インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス

_mm512_permute4f128_ps/_mm512_mask_permute4f128_ps

float32 ベクトルの 128 ビット・ブロックを並べ替えます。 対応する命令は VPERMF32X4 です。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。

構文

マスクなし

extern __m512 _mm512_permute4f128_ps(__m512 v2, int permute);

マスク付き

extern __m512 _mm512_mask_permute4f128_ps(__m512 v1_old, __mmask16 k1, __m512 v2, _MM_PERM_ENUM permute);

引数

v1_old デスティネーション・ベクトルの古い値を保持するソースベクトル。 マスクビットが 0 にセットされている場合は、v1_old の対応する要素が結果ベクトルにコピーされます。
v2 512 ビットの float32 ソースベクトル
k1 書き込みマスク。k1 マスクの対応するビットが 1 にセットされているソースベクトルの要素のみ計算され、結果に格納されます。 k1 の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル v1_old の要素からコピーされます。
permute 各 32 ビット・ブロックの要素の並べ替え方法を定義する定数。

説明

各ブロックの要素の並べ替えのインデックスとして permute 引数を使用して、float32 ベクトル v2 の 128 ビット・ブロックを並べ替えます。

マスク付きの結果ベクトルには、書き込みマスクベクトル k1 の対応するビットがセットされている要素がコピーされます。 マスク付きの結果ベクトルの残りの要素には、v1_old の要素がコピーされます。

マスクなしの組込み関数は、フルマスク (k1=0xffff) のマスク付き組込み関数と同等です。

戻り値

512 ビットの値が並べ替えられた float32 ベクトル。