インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス
3 つの float64 ベクトルを使用して、パックド倍精度浮動小数点値の乗算-減算を行います。対応する FMA 命令は VFMSUB<XXX>PD で、XXX は 132、213、または 231 です。
128 ビットのベクトルの場合
extern __m128d _mm_fmsub_pd(__m128d a, __m128d b, __m128d c); |
256 ビットのベクトルの場合
extern __m256d _mm256_fmsub_pd(__m256d a, __m256d b, __m256d c); |
a |
演算に使用する float64 ベクトル |
b |
演算に使用する float64 ベクトル |
c |
演算に使用する float64 ベクトル |
3 つのソースベクトル/オペランド a、b、c を使用して、パックド倍精度浮動小数点値の SIMD 乗算-減算を行います。2 つのオペランド a と b の対応する値を乗算し、無限の精度の中間結果を取得します。 そして、その中間結果から 3 つ目のオペランド c を引きます。 最終結果は、最も近い float64 値に丸められます。
コンパイラーは、デフォルトで VFMSUB213PD 命令を使用し、低レベルの最適化により有効または必要と判断された場合のみ、ほかの形式 (VFMSUB132PD あるいは VFMSUB231PD) を使用します。 例えば、レジスターの使用を抑えたり、移動を排除できる場合、コンパイラーはほかの形式を使用します。
乗算-減算の結果。