インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス

_mm512_mullo_epi32/_mm512_mask_mullo_epi32

int32 ベクトルを乗算し、結果の下位半分を格納します。対応する命令は VMULLPI です。 この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。

構文

マスクなし

extern _m512i __cdecl _mm512_mullo_epi32(_m512i v2, _m512i v3);

マスク付き

extern _m512i __cdecl _mm512_mask_mullo_epi32(_m512i v1_old, __mmask16 k1, _m512i v2, _m512i v3);

引数

v2

int32 ベクトル v3 と掛け合わせる int32 ベクトル

v3

int32 ベクトル v2 と掛け合わせる int32 ベクトル。メモリーまたは int32 ベクトルを使用するスウィズル/ブロードキャスト/変換処理の結果が含まれます。

v1_old

デスティネーション・ベクトルの古い値を保持するソースベクトル。マスクビットが 0 にセットされている場合は、v1_old の対応する要素が結果ベクトルにコピーされます。

k1

書き込みマスク。k1 マスクの対応するビットが '1' にセットされているソースベクトルの要素のみ計算され、結果に格納されます。k1 の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル v1_old の要素からコピーされます。

説明

int32 ベクトル v2 と int32 ベクトル v3 の要素単位の乗算を行います。 結果の下位 32 ビットは int32 結果ベクトルに書き込まれます。

マスク付きにはさらに引数 k1 があります。 ベクトルマスク k1 の対応するビットがセットされているソースレジスターの要素のみ計算に使用されます。 結果ベクトルの残りの要素には、v1_old の要素がコピーされます。

戻り値

int32 結果ベクトルに格納された乗算結果。