_mm512_[g]maxabs_ps/_mm512_mask_[g]maxabs

インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス

float32 ベクトルの絶対最大値を特定します。対応する命令は VGMAXABSPS です。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。

構文

マスクなし

extern _m512 __cdecl _mm512_gmaxabs_ps(_m512 v2, _m512 v3);

extern _m512 __cdecl _mm512_maxabs_ps(_m512 v2, _m512 v3);

マスク付き

extern _m512 __cdecl _mm512_mask_gmaxabs_ps(_m512 v1_old, __mmask16 k1, _m512 v2, _m512 v3);

extern _m512 __cdecl _mm512_mask_maxabs_ps(_m512 v1_old, __mmask16 k1, _m512 v2, _m512 v3);

引数

`v2`	絶対最大値を特定する float32 ベクトル (1 つ目のソースオペランド)
`v3`	絶対最大値を特定する float32 ベクトル (2 つ目のソースオペランド)
`v1_old`	デスティネーション・ベクトルの古い値を保持するソースベクトル。マスクビットが 0 にセットされている場合は、`v1_old` の対応する要素が結果ベクトルにコピーされます。
`k1`	書き込みマスク。`k1` マスクの対応するビットが '1' にセットされているソースベクトルの要素のみ計算され、結果に格納されます。`k1` の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル `v1_old` の要素からコピーされます。

説明

float32 ベクトル v2 と float32 ベクトル v3 の絶対最大値を特定します。

マスク付きにはさらに引数 k1 があります。ベクトルマスク k1 の対応するビットがセットされているソースレジスターの要素のみ計算に使用されます。

g が付くバージョン:

FpMax() は、一般に IEEE 規格に従って 2 つの float32 引数の大きい方を返します。以下は IEEE DX10 規格に従っています。

dest = src0 >= src1 ? src0 : src1

min(x,y) = x の場合に max(x,y) = y となるように、> の代わりに >= が使用されます。

NaN の特別な処理: ソースオペランドの 1 つが NaN の場合、もう一方のソースオペランドが返されます (選択はコンポーネントごとに行われます)。両方とも NaN の場合、1 つ目のソースオペランド (ここでは v2) のクワイエット型 NaN が返されます。これは、新しい IEEE 754R 規格に準拠します。

g がないバージョン:

FpMax() は、1 つ目のソースオペランド (v2) と 2 つ目のソースオペランド (v3) のパックド単精度浮動小数点値の SIMD 比較を行い、2 つの float32 引数の大きい方を返します。

比較する値が両方とも (符号に関係なく) 0.0 の場合、2 つ目のオペランドの値 (v3) が返されます。どちらか一方の値だけが NaN の場合、2 つ目のオペランド v3 (NaN または有効な浮動小数点値) が結果に書き込まれます。

戻り値

操作の結果。

_mm512_[g]maxabs_ps/_mm512_mask_[g]maxabs_ps

構文

引数

説明

戻り値

関連情報