インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス
float64 ベクトルを乗算、減算します。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。
マスクなし extern __m512d __cdecl _mm512_fmsub_pd(_m512d v1, __m512d v2, __m512d v3); extern __m512d __cdecl _mm512_fmsub_round_pd(_m512d v1, __m512d v2, __m512d v3, int rc); |
マスク付き extern __m512d __cdecl _mm512_mask_fmsub_pd(_m512d v1, __mmask8 k1, __m512d v2, __m512d v3); extern __m512d __cdecl _mm512_mask_fmsub_round_pd(_m512d v1, __mmask8 k1, __m512d v2, __m512d v3, int rc); extern __m512d __cdecl _mm512_mask3_fmsub_pd(_m512d v1, __m512d v2, __m512d v3, __mmask8 k1); extern __m512d __cdecl _mm512_mask3_fmsub_round_pd(_m512d v1, __m512d v2, __m512d v3, __mmask8 k1, int rc); |
v1 |
float64 ベクトル v2 と乗算する float64 ベクトル。
構文が v1_old ではなく v1 であることに注意してください。 |
v2 |
float64 ベクトルv1 と乗算する float64 ベクトル |
v3 |
v1 と v2 の積から減算する float64 ベクトル。 |
k1 |
書き込みマスク。k1 マスクの対応するビットが '1' にセットされているソースベクトルの要素のみ計算され、結果に格納されます。k1 の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル v1_old の要素からコピーされます。 |
rc |
丸め制御値。次のいずれかになります。
|
float64 ベクトル v1 と float64 ベクトル v2 間で要素単位の乗算を行った後、結果から float64 ベクトル v3 を減算します。 中間値は無限の精度で計算されます。rc 引数を指定しない限り、切り捨てられることも、丸められることもありません。
マスク付きにはさらに引数 k1 があります。 ベクトルマスク k1 の対応するビットがセットされているソースレジスターの要素のみ計算に使用されます。 書き込みマスクが使用されると、マスク引数の直前のベクトル引数からのパススルー値が返されます。例えば、_mm512_mask_fmsub_pd(v1, k1, v2, v3) は v1 からのパススルー値、_mm512_mask3_fmsub_pd(v1, v2, v3, k3) は v3 からのパススルー値が返されます。v2 からのパススルー値を取得するには、_mask_ 形式で v1 と v2 の順序を逆にします。
乗算-減算の結果。