インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 組込み関数のプロトタイプは、zmmintrin.h ヘッダーファイルで定義されていますが、実際にヘッダーをコードにインクルードする場合は、immintrin.h を使用します。
組込み関数名 |
演算 |
対応するインテル® AVX-512 命令 |
---|---|---|
_mm512_lzcnt_epi32、 _mm512_mask_lzcnt_epi32、 _mm512_maskz_lzcnt_epi32 |
int32 ソース要素の先頭からのゼロ・ビットの数をカウントします。 |
VPLZCNTD |
_mm512_lzcnt_epi64、 _mm512_mask_lzcnt_epi64、 _mm512_maskz_lzcnt_epi64 |
int64 ソース要素の先頭からのゼロ・ビットの数をカウントします。 |
VPLZCNTQ |
_mm512_ternarylogic_epi32、 _mm512_mask_ternarylogic_epi32、 _mm512_maskz_ternarylogic_epi32 |
即値で指定されたオペランドが 3 つのバイナリー関数を実装します。 |
VPTERNLOGD |
_mm512_ternarylogic_epi64、 _mm512_mask_ternarylogic_epi64、 _mm512_maskz_ternarylogic_epi64 |
即値で指定されたオペランドが 3 つのバイナリー関数を実装します。 |
VPTERNLOGQ |
変数 | 定義 |
---|---|
k | セレクターとして使用される書き込みマスク |
a | 1 つ目のソースベクトルの要素 |
b | 2 つ目のソースベクトルの要素 |
c | 3 つ目のソースベクトルの要素 |
imm8 | バイナリー関数指示子 |
src | 書き込みマスクの結果に応じて使用されるソース要素 |
_mm512_lzcnt_epi32
extern __m512i __cdecl _mm512_lzcnt_epi32(__m512i a);
a の各パックド 32 ビット整数の先頭からのゼロ・ビットの数をカウントし、結果をデスティネーションに格納します。
_mm512_mask_lzcnt_epi32
extern __m512i __cdecl _mm512_mask_lzcnt_epi32(__m512i src, __mmask16 k, __m512i a);
a の各パックド 32 ビット整数の先頭からのゼロ・ビットの数をカウントし、書き込みマスク k を使用して結果をデスティネーションに格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。
_mm512_maskz_lzcnt_epi32
extern __m512i __cdecl _mm512_maskz_lzcnt_epi32(__mmask16 k, __m512i a);
a の各パックド 32 ビット整数の先頭からのゼロ・ビットの数をカウントし、ゼロマスク k を使用して結果をデスティネーションに格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。
_mm512_lzcnt_epi64
extern __m512i __cdecl _mm512_lzcnt_epi64(__m512i a);
a の各パックド 64 ビット整数の先頭からのゼロ・ビットの数をカウントし、結果をデスティネーションに格納します。
_mm512_mask_lzcnt_epi64
extern __m512i __cdecl _mm512_mask_lzcnt_epi64(__m512i src, __mmask8 k, __m512i a);
a の各パックド 64 ビット整数の先頭からのゼロ・ビットの数をカウントし、書き込みマスク k を使用して結果をデスティネーションに格納します。
マスクの対応するビットが設定されていない場合は src の要素がコピーされます。
_mm512_maskz_lzcnt_epi64
extern __m512i __cdecl _mm512_maskz_lzcnt_epi64(__mmask8 k, __m512i a);
a の各パックド 64 ビット整数の先頭からのゼロ・ビットの数をカウントし、ゼロマスク k を使用して結果をデスティネーションに格納します。
マスクの対応するビットが設定されていない場合は要素が 0 に設定されます。
_mm512_ternarylogic_epi32
extern __m512i __cdecl _mm512_ternarylogic_epi32(__m512i a, __m512i b, __m512i c, int imm8);
ビット単位の 3 値論理により、imm8 の値によって指定されたオペランドが 3 つのバイナリー関数を実装します。
各パックド 32 ビット整数の各ビットごとに、a、b、c の対応するビットから imm8 への 3 ビットのインデックスを形成し、インデックスで指定された imm8 のビット位置にある値を対応するデスティネーション・ビットに書き込みます。
_mm512_mask_ternarylogic_epi32
extern __m512i __cdecl _mm512_mask_ternarylogic_epi32(__m512i a, __mmask16 k, __m512i, __m512i b, int imm8);
ビット単位の 3 値論理により、imm8 の値によって指定されたオペランドが 3 つのバイナリー関数を実装します。
各パックド 32 ビット整数の各ビットごとに、src、a、b の対応するビットから imm8 への 3 ビットのインデックスを形成し、インデックスで指定された imm8 のビット位置にある値を、書き込みマスク k を使用して対応するデスティネーション・ビットに 32 ビット単位で書き込みます (マスクの対応するビットが設定されていない場合は src の 32 ビット要素がコピーされます)。
_mm512_maskz_ternarylogic_epi32
extern __m512i __cdecl _mm512_maskz_ternarylogic_epi32(__mmask16 k, __m512i a, __m512i b, __m512i c, int imm8);
ビット単位の 3 値論理により、imm8 の値によって指定されたオペランドが 3 つのバイナリー関数を実装します。
各パックド 32 ビット整数の各ビットごとに、src、a、b の対応するビットから imm8 への 3 ビットのインデックスを形成し、インデックスで指定された imm8 のビット位置にある値を、書き込みマスク k を使用して対応するデスティネーション・ビットに 32 ビット単位で書き込みます (マスクの対応するビットが設定されていない場合は 32 ビット要素が 0 に設定されます)。
_mm512_ternarylogic_epi64
extern __m512i __cdecl _mm512_ternarylogic_epi64(__m512i a, __m512i b, __m512i c, int imm8);
ビット単位の 3 値論理により、imm8 の値によって指定されたオペランドが 3 つのバイナリー関数を実装します。
各パックド 64 ビット整数の各ビットごとに、a、b、c の対応するビットから imm8 への 3 ビットのインデックスを形成し、インデックスで指定された imm8 のビット位置にある値を対応するデスティネーション・ビットに書き込みます。
_mm512_mask_ternarylogic_epi64
extern __m512i __cdecl _mm512_mask_ternarylogic_epi64(__m512i src, __mmask8 k, __m512i a, __m512i b, int imm8);
ビット単位の 3 値論理により、imm8 の値によって指定されたオペランドが 3 つのバイナリー関数を実装します。
各パックド 64 ビット整数の各ビットごとに、src、a、b の対応するビットから imm8 への 3 ビットのインデックスを形成し、インデックスで指定された imm8 のビット位置にある値を、書き込みマスク k を使用して対応するデスティネーション・ビットに 64 ビット単位で書き込みます (マスクの対応するビットが設定されていない場合は src の 64 ビット要素がコピーされます)。
_mm512_maskz_ternarylogic_epi64
extern __m512i __cdecl _mm512_maskz_ternarylogic_epi64(__mmask8 k, __m512i a, __m512i b, __m512i c, int imm8);
ビット単位の 3 値論理により、imm8 の値によって指定されたオペランドが 3 つのバイナリー関数を実装します。
各パックド 64 ビット整数の各ビットごとに、src、a、b の対応するビットから imm8 への 3 ビットのインデックスを形成し、インデックスで指定された imm8 のビット位置にある値を、書き込みマスク k を使用して対応するデスティネーション・ビットに 64 ビット単位で書き込みます (マスクの対応するビットが設定されていない場合は 64 ビット要素が 0 に設定されます)。