インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス
float32 ベクトルを乗算、加算します。対応する命令は VMADD233PS です。 この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。
マスクなし extern __m512 __cdecl _mm512_fmadd233_ps(__m512 v2, __m512 v3); extern __m512 __cdecl _mm512_fmadd233_round_ps(__m512 v2, __m512 v3 int rc); |
マスク付き extern __m512 __cdecl _mm512_mask_fmadd233_ps(__m512 v1_old, __mmask16 k1, __m512 v2, __m512 v3); extern __m512 __cdecl _mm512_mask_fmadd233_round_ps(__m512 v1_old, __mmask16 k1, __m512 v2, __m512 v3 int rc); |
v2 |
float32 ベクトル v3 の特定の要素に乗算する float32 ベクトル。 |
v3 |
float32 ベクトル。このベクトルの特定の要素が float32 ベクトル v2 に乗算された後、特定の要素が v2 と v3 の積に加算されます。 |
v1_old |
デスティネーション・ベクトルの古い値を保持するソースベクトル。マスクビットが 0 にセットされている場合は、v1_old の対応する要素が結果ベクトルにコピーされます。 |
k1 |
書き込みマスク。k1 マスクの対応するビットが '1' にセットされているソースベクトルの要素のみ計算され、結果に格納されます。k1 の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル v1_old の要素からコピーされます。 |
rc |
丸め制御値。次のいずれかになります。
|
float32 ベクトル v2 と float32 ベクトル v3 の特定の要素間の乗算を行った後、結果に float32 ベクトル v3 の特定の要素を加算します。 中間値は無限の精度で計算されます。rc 引数を指定しない限り、切り捨てられることも、丸められることもありません。
マスク付きにはさらに引数 k1 があります。 ベクトルマスク k1 の対応するビットがセットされているソースレジスターの要素のみ計算に使用されます。 結果ベクトルの残りの要素には、v1_old の要素がコピーされます。
乗算-加算の結果。