インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス

_mm512_reduce_[g]max_ps/_mm512_mask_reduce_[g]max_ps

float32 ベクトル中の最大スカラー値を持つ要素を特定します。対応する命令はありません。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。

構文

マスクなし

extern float __cdecl _mm512_reduce_gmax_ps(_m512 v2);

extern float __cdecl _mm512_reduce_max_ps(_m512 v2);

マスク付き

extern float __cdecl _mm512_mask_reduce_gmax_ps(__mmask16 k1, _m512 v2);

extern float __cdecl _mm512_mask_reduce_max_ps(__mmask16 k1, _m512 v2);

引数

v2

最大値を特定する float32 ベクトル

k1

書き込みマスク。k1 マスクの対応するビットが '1' にセットされているソースベクトルの要素のみ計算され、結果に格納されます。

説明

float32 ベクトル v2 中の最大スカラー値を持つ要素を特定します。

マスク付きにはさらに引数 k1 があります。 ベクトルマスク k1 の対応するビットがセットされているソースレジスターの要素のみ計算に使用されます。 k1 の対応するビットがクリアされている v2 の要素は、結果ベクトルにそのままコピーされます。

g が付くバージョン:

FpMax() は、一般に IEEE 規格従って v2 の 2 つの要素の大きい方を返しますが、以下は特に IEEE DX10 規格に従っています。

dest = src0 >= src1 ? src0 : src1

min(x,y) = x の場合に max(x,y) = y となるように、> の代わりに >= が使用されます。

 NaN の特別な処理: 要素の 1 つが NaN の場合、もう一方の要素が返されます (選択はコンポーネントごとに行われます)。両方とも NaN の場合、v2 の 1 つ目の要素が返されます。 これは、新しい IEEE 754R 規格に準拠します。

g がないバージョン:

FpMax() は、v2 の 2 つの要素のパックド単精度浮動小数点値の SIMD 比較を行い、大きい方を返します。

比較する値が両方とも (符号に関係なく) 0.0 の場合、v2 の 2 つ目の要素の値が返されます。 どちらか一方の値だけが NaN の場合、v2 の 2 つ目の要素 (NaN または有効な浮動小数点値) が結果に書き込まれます。

戻り値

操作の結果。