インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス
int32 ベクトルの 32 ビット・ブロックを並べ替えます。対応する命令は VPERMD です。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。
マスクなし extern __m512i __cdecl _mm512_permutevar_epi32(__m512i v2, __m512i v3); |
マスク付き extern __m512i __cdecl _mm512_mask_permutevar_epi32(__m512i v1_old, __mmask16 k1, __m512i v2, __m512i v3); |
v1_old | デスティネーション・ベクトルの古い値を保持するソースベクトル。マスクビットが 0 にセットされている場合は、v1_old の対応する要素が結果ベクトルにコピーされます。 |
v2 | 並べ替えのインデックスを含む int32 ベクトル。 |
v3 | ソース int32 ベクトル。 |
k1 | 書き込みマスク。k1 マスクの対応するビットが 1 にセットされているソースベクトルの要素のみ計算され、結果に格納されます。k1 の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル v1_old の要素からコピーされます。 |
int32 ベクトル v2 のインデックスで int32 ベクトル v3 の 32 ビット・ブロックを並べ替えます。結果の i 番目の要素は v3 の j 番目の要素です (j は v2 の i 番目の要素)。
マスク付きの結果ベクトルには、書き込みマスクベクトル k1 の対応するビットがセットされている要素がコピーされます。マスク付きの結果ベクトルの残りの要素には、v1_old の要素がコピーされます。
マスクなしの組込み関数は、フルマスク (k1=0xffff) のマスク付き組込み関数と同等です。
並べ替えの結果。