インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス
float32 ベクトルの 128 ビット・ブロックを並べ替えます。 対応する命令は VPERMF32X4 です。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。
マスクなし extern __m512 _mm512_permute4f128_ps(__m512 v2, int permute); |
マスク付き extern __m512 _mm512_mask_permute4f128_ps(__m512 v1_old, __mmask16 k1, __m512 v2, _MM_PERM_ENUM permute); |
v1_old | デスティネーション・ベクトルの古い値を保持するソースベクトル。 マスクビットが 0 にセットされている場合は、v1_old の対応する要素が結果ベクトルにコピーされます。 |
v2 | 512 ビットの float32 ソースベクトル |
k1 | 書き込みマスク。k1 マスクの対応するビットが 1 にセットされているソースベクトルの要素のみ計算され、結果に格納されます。 k1 の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル v1_old の要素からコピーされます。 |
permute | 各 32 ビット・ブロックの要素の並べ替え方法を定義する定数。 |
各ブロックの要素の並べ替えのインデックスとして permute 引数を使用して、float32 ベクトル v2 の 128 ビット・ブロックを並べ替えます。
マスク付きの結果ベクトルには、書き込みマスクベクトル k1 の対応するビットがセットされている要素がコピーされます。 マスク付きの結果ベクトルの残りの要素には、v1_old の要素がコピーされます。
マスクなしの組込み関数は、フルマスク (k1=0xffff) のマスク付き組込み関数と同等です。
512 ビットの値が並べ替えられた float32 ベクトル。