インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス
丸めた float32 ベクトルを加算し、マスクに符号を設定します。対応する命令は VADDSETSPS です。 この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。
マスクなし extern _m512 __cdecl _mm512_addsets_round_ps(_m512 v2, _m512 v3, __mmask16* sign, int rc); |
マスク付き extern _m512 __cdecl _mm512_mask_addsets_round_ps(_m512 v1_old, __mmask16 k1, _m512 v2, _m512 v3, __mmask16* sign, int rc); |
v2 |
比較に使用する float32 ベクトル |
v3 |
比較に使用する float32 ベクトル |
v1_old |
デスティネーション・ベクトルの古い値を保持するソースベクトル。マスクビットが 0 にセットされている場合は、v1_old の対応する要素が結果ベクトルにコピーされます。 |
k1 |
書き込みマスク。k1 マスクの対応するビットが '1' にセットされているソースベクトルの要素のみ計算され、結果に格納されます。 |
sign |
結果の符合を格納する k1 マスクレジスターの場所へのポインター |
rc |
丸め制御値。次のいずれかになります。
|
float32 ベクトル v2 と float32 ベクトル v3 の要素単位の加算を行います。 中間値は、rc の値に応じて丸められます。
加算結果の符合は sign で返されます。
マスク付きには 2 つの追加の引数 (v1_old と k1) があります。 ベクトルマスク k1 の対応するビットがクリアされている v2 と v3 の要素は計算に使用されません。 代わりに、v1_old から結果ベクトルに対応する要素がコピーされます。
加算の結果。加算結果の符合は sign で返されます。