インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 組込み関数のプロトタイプは、zmmintrin.h ヘッダーファイルで定義されていますが、実際にヘッダーをコードにインクルードする場合は、immintrin.h を使用します。
組込み関数名 |
演算 |
対応するインテル® AVX-512 命令 |
---|---|---|
_mm512_mul_epi32、 _mm512_mask_mul_epi32、 _mm512_maskz_mul_epi32 |
特定の int32 ベクトルを乗算します。結果は int64 になります。 |
VPMULDQ |
_mm512_mul_epu32、 _mm512_mask_mul_epu32、 _mm512_maskz_mul_epu32 |
特定の符号なし int32 ベクトルを乗算します。結果は int64 になります。 |
VPMULUDQ |
_mm512_mullo_epi32、 _mm512_mask_mullo_epi32 |
int32 ベクトルを乗算します。結果は int64 になります。 |
VPMULLD |
_mm512_mullox_epi64、 _mm512_mask_mullox_epi64 |
int64 ベクトルを乗算します。結果は int64 になります。 |
なし |
変数 | 定義 |
---|---|
k | セレクターとして使用される書き込みマスク |
a | 1 つ目のソースベクトルの要素 |
b | 2 つ目のソースベクトルの要素 |
src | 書き込みマスクの結果に応じて使用されるソース要素 |
_mm512_mul_epi32
extern __m512i __cdecl _mm512_mul_epi32(__m512i a, __m512i b);
a と b のパックド 64 ビット要素の int32 下位要素を乗算し、結果の符号付き 64 ビットを格納します。
_mm512_mask_mul_epi32
extern __m512i __cdecl _mm512_mask_mul_epi32(__m512i src, __mmask8 k, __m512i a, __m512i b);
a と b のパックド 64 ビット要素の int32 下位要素を乗算し、書き込みマスク k を使用して結果の符号付き 64 ビットを格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_mul_epi32
extern __m512i __cdecl _mm512_maskz_mul_epi32(__mmask8 k, __m512i a, __m512i b);
a と b のパックド 64 ビット要素の int32 下位要素を乗算し、ゼロマスク k を使用して結果の符号付き 64 ビットを格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_mullo_epi32
extern __m512i __cdecl _mm512_mullo_epi32(__m512i a, __m512i b);
a と b のパックド int32 要素を乗算し、結果の int64 要素の下位 32 ビットを格納します。
_mm512_mask_mullo_epi32
extern __m512i __cdecl _mm512_mask_mullo_epi32(__m512i src, __mmask16 k, __m512i a, __m512i b);
a と b のパックド int32 要素を乗算し、書き込みマスク k を使用して結果の int64 要素の下位 32 ビットを格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_mul_epu32
extern __m512i __cdecl _mm512_mul_epu32(__m512i a, __m512i b);
a と b のパックド 64 ビット要素の符号なし int32 下位要素を乗算し、結果の符号なし 64 ビットを格納します。
_mm512_mask_mul_epu32
extern __m512i __cdecl _mm512_mask_mul_epu32(__m512i src, __mmask8 k, __m512i a, __m512i b);
a と b のパックド 64 ビット要素の符号なし int32 下位要素を乗算し、書き込みマスク k を使用して結果の符号なし 64 ビットを格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_mul_epu32
extern __m512i __cdecl _mm512_maskz_mul_epu32(__mmask8 k, __m512i a, __m512i b);
a と b のパックド 64 ビット要素の符号なし int32 下位要素を乗算し、ゼロマスク k を使用して結果の符号なし 64 ビットを格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_mullox_epi64
extern __m512i __cdecl _mm512_mullox_epi64(__m512i a, __m512i b);
a と b の各パックド int64 要素を乗算し、それぞれの積の下位ビットを選択します。
_mm512_mask_mullox_epi64
extern __m512i __cdecl _mm512_mask_mullox_epi64(__m512i, __mmask8 k, __m512i a, __m512i b);
a と b の各パックド int64 要素を乗算し、ゼロマスク k を使用してそれぞれの積の下位ビットを選択します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。