インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 組込み関数のプロトタイプは、zmmintrin.h ヘッダーファイルで定義されていますが、実際にヘッダーをコードにインクルードする場合は、immintrin.h を使用します。
組込み関数名 |
演算 |
対応するインテル® AVX-512 命令 |
---|---|---|
_mm512_extracti32x4_epi32、 _mm512_mask_extracti32x4_epi32、 _mm512_maskz_extracti32x4_epi32 |
int32 値を抽出します。 |
VEXTRACTI32X4 |
_mm512_extracti64x4_epi64、 _mm512_mask_extracti64x4_epi64、 _mm512_maskz_extracti64x4_epi64 |
int64 値を抽出します。 |
VEXTRACTI64X4 |
_mm512_inserti32x4_epi32、 _mm512_mask_inserti32x4_epi32、 _mm512_maskz_inserti32x4_epi32 |
int32 値を挿入します。 |
VINSERTI32X4 |
_mm512_inserti64x4_epi64、 _mm512_mask_inserti64x4_epi64、 _mm512_maskz_inserti64x4_epi64 |
int64 値を挿入します。 |
VINSERTI64X4 |
変数 | 定義 |
---|---|
k | セレクターとして使用される書き込みマスク |
a | 1 つ目のソースベクトルの要素 |
mem_addr | メモリーのベースアドレスへのポインター |
src | 書き込みマスクの結果に応じて使用されるソース要素 |
tmp | imm で指定された一時領域の場所 |
imm | 一時領域の場所 tmp を指定する値 |
_mm512_extracti32x4_epi32
extern __m128i __cdecl _mm512_extracti32x4_epi32(__m512i a, int imm);
imm で選択された 128 ビット (4 つのパックド 32 ビット整数) を a から抽出し、結果を格納します。
_mm512_mask_extracti32x4_epi32
extern __m128i __cdecl _mm512_mask_extracti32x4_epi32(__m128i src, __mmask8 k, __m512i a, int imm);
imm で選択された 128 ビット (4 つのパックド 32 ビット整数) を a から抽出し、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_extracti32x4_epi32
extern __m128i __cdecl _mm512_maskz_extracti32x4_epi32(__mmask8 k, __m512i a, int imm);
imm で選択された 128 ビット (4 つのパックド 32 ビット整数) を a から抽出し、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_extracti64x4_epi64
extern __m256i __cdecl _mm512_extracti64x4_epi64(__m512i a, int imm);
imm で選択された 256 ビット (4 つのパックド int64 要素) を a から抽出し、結果を格納します。
_mm512_mask_extracti64x4_epi64
extern __m256i __cdecl _mm512_mask_extracti64x4_epi64(__m256i src, __mmask8 k, __m512i a, int imm);
imm で選択された 256 ビット (4 つのパックド int64 要素) を a から抽出し、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_extracti64x4_epi64
extern __m256i __cdecl _mm512_maskz_extracti64x4_epi64(__mmask8 k, __m512i a, int imm);
imm で選択された 256 ビット (4 つのパックド int64 要素) を a から抽出し、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_inserti32x4
extern __m512i __cdecl _mm512_inserti32x4(__m512i a, __m128i b, int imm);
a をデスティネーションにコピーし、デスティネーションの imm で指定された位置に b の 128 ビット (4 つのパックド 32 ビット整数) を挿入します。
_mm512_mask_inserti32x4
extern __m512i __cdecl _mm512_mask_inserti32x4(__m512i src, __mmask16 k, __m512i a, __m128i b, int imm);
_mm512_maskz_inserti32x4
extern __m512i __cdecl _mm512_maskz_inserti32x4(__mmask16 k, __m512i a, __m128i b, int imm);
a を tmp にコピーし、tmp の imm で指定された位置に b の 256 ビット (4 つのパックド倍精度 (64 ビット) 浮動小数点要素) を挿入します。
ゼロマスク k を使用して tmp をデスティネーションに格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_inserti64x4
extern __m512i __cdecl _mm512_inserti64x4(__m512i a, __m256i b, int imm);
a を tmp にコピーし、tmp の imm で指定された位置に b の 256 ビット (4 つのパックド int64 要素) を挿入します。
_mm512_mask_inserti64x4
extern __m512i __cdecl _mm512_mask_inserti64x4(__m512i src, __mmask8 k, __m512i a, __m256i b, int imm);
a を tmp にコピーし、tmp の imm で指定された位置に b の 256 ビット (4 つのパックド int64 要素) を挿入します。書き込みマスク k を使用して tmp をデスティネーションに格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_inserti64x4
extern __m512i __cdecl _mm512_maskz_inserti64x4(__mmask8 k, __m512i a, __m256i b, int imm);
a を tmp にコピーし、tmp の imm で指定された位置に b の 128 ビット (4 つのパックド 32 ビット整数) を挿入します。ゼロマスク k を使用して tmp をデスティネーションに格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。