インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス

逆数演算の組込み関数

インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 組込み関数のプロトタイプは、zmmintrin.h ヘッダーファイルで定義されていますが、実際にヘッダーをコードにインクルードする場合は、immintrin.h を使用します。


組込み関数名

演算

対応するインテル® AVX-512 命令

_mm512_rcp14_pd_mm512_mask_rcp14_pd_mm512_maskz_rcp14_pd

パックド float64 要素の逆数の近似値を計算します。

VRCP14PD

_mm512_rcp14_ps_mm512_mask_rcp14_ps_mm512_maskz_rcp14_ps

パックド float32 要素の逆数の近似値を計算します。

VRCP14PS

_mm_rcp14_sd_mm_mask_rcp14_sd_mm_maskz_rcp14_sd

スカラー float64 要素の逆数の近似値を計算します。

VRCP14SD

_mm_rcp14_ss_mm_mask_rcp14_ss_mm_maskz_rcp14_ss

スカラー float32 要素の逆数の近似値を計算します。

VRCP14SS

_mm512_rcp28_pd_mm512_mask_rcp28_pd_mm512_maskz_rcp28_pd

_mm512_rcp28_round_pd_mm512_mask_rcp28_round_pd_mm512_maskz_rcp28_round_pd

相対誤差の範囲内でパックド float64 要素の逆数の近似値を計算します。

VRCP28PD

_mm_rcp28_sd_mm_mask_rcp28_sd_mm_maskz_rcp28_sd

_mm_rcp28_round_sd_mm_mask_rcp28_round_sd_mm_maskz_rcp28_round_sd

相対誤差の範囲内でスカラー float64 要素の逆数の近似値を計算します。

VRCP28SD

_mm512_rcp28_ps_mm512_mask_rcp28_ps_mm512_maskz_rcp28_ps

_mm512_rcp28_round_ps_mm512_mask_rcp28_round_ps_mm512_maskz_rcp28_round_ps

相対誤差の範囲内でパックド float32 要素の逆数の近似値を計算します。

VRCP28PS

_mm_rcp28_ss_mm_mask_rcp28_ss_mm_maskz_rcp28_ss

_mm_rcp28_round_ss_mm_mask_rcp28_round_ss_mm_maskz_rcp28_round_ss

相対誤差の範囲内でスカラー float32 要素の逆数の近似値を計算します。

VRCP28SS

_mm512_recip_pd_mm512_mask_recip_pd

パックド float64 要素の逆数の近似値を計算します。

なし

_mm512_recip_ps_mm512_mask_recip_ps

パックド float32 要素の逆数の近似値を計算します。

なし


変数 定義
k

セレクターとして使用される書き込みマスク

a

1 つ目のソースベクトルの要素

b

2 つ目のソースベクトルの要素

src

書き込みマスクの結果に応じて使用されるソース要素


_mm512_rcp14_pd

extern __m512d __cdecl _mm512_rcp14_pd(__m512d a);

a のパックド float64 要素の逆数の近似値を計算し、結果を格納します。

この近似値の最大相対誤差は 2(-14) 未満です。


_mm512_mask_rcp14_pd

extern __m512d __cdecl _mm512_mask_rcp14_pd(__m512d src, __mmask8 k, __m512d a);

a のパックド float64 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。

この近似値の最大相対誤差は 2(-14) 未満です。


_mm512_maskz_rcp14_pd

extern __m512d __cdecl _mm512_maskz_rcp14_pd(__mmask8 k, __m512d a);

a のパックド float64 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。

この近似値の最大相対誤差は 2(-14) 未満です。



_mm512_rcp14_ps

extern __m512 __cdecl _mm512_rcp14_ps(__m512 a);

a のパックド float32 要素の逆数の近似値を計算し、結果を格納します。

この近似値の最大相対誤差は 2(-14) 未満です。


_mm512_mask_rcp14_ps

extern __m512 __cdecl _mm512_mask_rcp14_ps(__m512 src, __mmask16 k, __m512 a);

a のパックド float32 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。

この近似値の最大相対誤差は 2(-14) 未満です。


_mm512_maskz_rcp14_ps

extern __m512 __cdecl _mm512_maskz_rcp14_ps(__mmask16 k, __m512 a);

a のパックド float32 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。

この近似値の最大相対誤差は 2(-14) 未満です。



_mm_rcp14_sd

extern __m128d __cdecl _mm_rcp14_sd(__m128d a, __m128d b);

b の下位 float64 要素の逆数の近似値を計算し、結果をデスティネーションの下位要素に格納し、a の上位要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-14) 未満です。


_mm_mask_rcp14_sd

extern __m128d __cdecl _mm_mask_rcp14_sd(__m128d src, __mmask8 k, __m128d a, __m128d b);

b の下位 float64 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は src の要素がコピーされます)、a の上位要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-14) 未満です。


_mm_maskz_rcp14_sd

extern __m128d __cdecl _mm_maskz_rcp14_sd(__mmask8 k, __m128d a, __m128d b);

b の下位 float64 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は要素が 0 に設定されます)、a の上位要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-14) 未満です。



_mm_rcp14_ss

extern __m128 __cdecl _mm_rcp14_ss(__m128 a, __m128 b);

b の下位 float32 要素の逆数の近似値を計算し、結果をデスティネーションの下位要素に格納し、a の上位 3 つのパックド要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-14) 未満です。


_mm_mask_rcp14_ss

extern __m128 __cdecl _mm_mask_rcp14_ss(__m128 src, __mmask8 k, __m128 a, __m128 b);

b の下位 float32 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は src の要素がコピーされます)、a の上位 3 つのパックド要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-14) 未満です。


_mm_maskz_rcp14_ss

extern __m128 __cdecl _mm_maskz_rcp14_ss(__mmask8 k, __m128 a, __m128 b);

b の下位 float32 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は要素が 0 に設定されます)、a の上位 3 つのパックド要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-14) 未満です。



_mm512_rcp28_round_pd

extern __m512d __cdecl _mm512_rcp28_round_pd(__m512d a);

a のパックド float64 要素の逆数の近似値を計算し、結果を格納します。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_mask_rcp28_round_pd

extern __m512d __cdecl _mm512_mask_rcp28_round_pd(__m512d src, __mmask8 k, __m512d a);

a のパックド float64 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_maskz_rcp28_round_pd

extern __m512d __cdecl _mm512_maskz_rcp28_round_pd(__mmask8 k, __m512d a);

a のパックド float64 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。

この近似値の最大相対誤差は 2(-28) 未満です。



_mm512_rcp28_pd

extern __m512d __cdecl _mm512_rcp28_pd(__m512d a);

a のパックド float64 要素の逆数の近似値を計算し、結果を格納します。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_mask_rcp28_pd

extern __m512d __cdecl _mm512_mask_rcp28_pd(__m512d src, __mmask8 k, __m512d a);

a のパックド float64 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_maskz_rcp28_pd

extern __m512d __cdecl _mm512_maskz_rcp28_pd(__mmask8 k, __m512d a);

a のパックド float64 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。

この近似値の最大相対誤差は 2(-28) 未満です。



_mm512_rcp28_round_ps

extern __m512 __cdecl _mm512_rcp28_round_ps(__m512 a);

a のパックド float32 要素の逆数の近似値を計算し、結果を格納します。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_mask_rcp28_round_ps

extern __m512 __cdecl _mm512_mask_rcp28_round_ps(__m512 src, __mmask16 k, __m512 a);

a のパックド float32 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_maskz_rcp28_round_ps

extern __m512 __cdecl _mm512_maskz_rcp28_round_ps(__mmask16 k, __m512 a);

a のパックド float32 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。

この近似値の最大相対誤差は 2(-28) 未満です。



_mm512_rcp28_ps

extern __m512 __cdecl _mm512_rcp28_ps(__m512 a);

a のパックド float32 要素の逆数の近似値を計算し、結果を格納します。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_mask_rcp28_ps

extern __m512 __cdecl _mm512_mask_rcp28_ps(__m512 src, __mmask16 k, __m512 a);

a のパックド float32 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_maskz_rcp28_ps

extern __m512 __cdecl _mm512_maskz_rcp28_ps(__mmask16 k, __m512 a);

a のパックド float32 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は要素が 0 に設定されます)。

この近似値の最大相対誤差は 2(-28) 未満です。



_mm512_rcp28_round_sd

extern __m128d __cdecl _mm512_rcp28_round_sd(__m128d a, __m128d b);

b の下位 float64 要素の逆数の近似値を計算し、結果をデスティネーションの下位要素に格納し、a の上位要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_mask_rcp28_round_sd

extern __m128d __cdecl _mm512_mask_rcp28_round_sd(__m128d src, __mmask8 k, __m128d a, __m128d b);

b の下位 float64 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は src の要素がコピーされます)、a の上位要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_maskz_rcp28_round_sd

extern __m128d __cdecl _mm512_maskz_rcp28_round_sd(__mmask8 k, __m128d a, __m128d b);

b の下位 float64 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は要素が 0 に設定されます)、a の上位要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。



_mm512_rcp28_round_sd

extern __m128d __cdecl _mm512_rcp28_round_sd(__m128d a, __m128d b);

b の下位 float64 要素の逆数の近似値を計算し、結果をデスティネーションの下位要素に格納し、a の上位要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_mask_rcp28_round_sd

extern __m128d __cdecl _mm512_mask_rcp28_round_sd(__m128d src, __mmask8 k, __m128d a, __m128d b);

b の下位 float64 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は src の要素がコピーされます)、a の上位要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_maskz_rcp28_round_sd

extern __m128d __cdecl _mm512_maskz_rcp28_round_sd(__mmask8 k, __m128d a, __m128d b);

b の下位 float64 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は要素が 0 に設定されます)、a の上位要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。



_mm512_rcp28_round_ss

extern __m128 __cdecl _mm512_rcp28_round_ss(__m128 a, __m128 b);

b の下位 float32 要素の逆数の近似値を計算し、結果をデスティネーションの下位要素に格納し、a の上位 3 つのパックド要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_mask_rcp28_round_ss

extern __m128 __cdecl _mm512_mask_rcp28_round_ss(__m128 src, __mmask8 k, __m128 a, __m128 b);

b の下位 float32 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は src の要素がコピーされます)、a の上位 3 つのパックド要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_maskz_rcp28_round_ss

extern __m128 __cdecl _mm512_maskz_rcp28_round_ss(__mmask8 k, __m128 a, __m128 b);

b の下位 float32 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は要素が 0 に設定されます)、a の上位 3 つのパックド要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。



_mm512_rcp28_ss

extern __m128 __cdecl _mm512_rcp28_ss(__m128 a, __m128 b);

b の下位 float32 要素の逆数の近似値を計算し、結果をデスティネーションの下位要素に格納し、a の上位 3 つのパックド要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_mask_rcp28_ss

extern __m128 __cdecl _mm512_mask_rcp28_ss(__m128 src, __mmask8 k, __m128 a, __m128 b);

b の下位 float32 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は src の要素がコピーされます)、a の上位 3 つのパックド要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。


_mm512_maskz_rcp28_ss

extern __m128 __cdecl _mm512_maskz_rcp28_ss(__mmask8 k, __m128 a, __m128 b);

b の下位 float32 要素の逆数の近似値を計算し、ゼロマスク k を使用して結果をデスティネーションの下位要素に格納し (マスクビット 0 が設定されていない場合は要素が 0 に設定されます)、a の上位 3 つのパックド要素をデスティネーションの上位要素にコピーします。

この近似値の最大相対誤差は 2(-28) 未満です。



_mm512_recip_pd

extern __m512d __cdecl _mm512_recip_pd(__m512d a);

a の float64 要素の逆数の近似値を計算し、結果を格納します。


_mm512_mask_recip_pd

extern __m512d __cdecl _mm512_mask_recip_pd(__m512d src, __mmask8 k, __m512d a);

a の float64 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。



_mm512_recip_ps

extern __m512 __cdecl _mm512_recip_ps(__m512 a);

a の float32 要素の逆数の近似値を計算し、結果を格納します。


_mm512_mask_recip_ps

extern __m512 __cdecl _mm512_mask_recip_ps(__m512 src, __mmask16 k, __m512 a);

a の float32 要素の逆数の近似値を計算し、書き込みマスク k を使用して結果を格納します (マスクの対応するビットが設定されていない場合は src の要素がコピーされます)。