インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス
float32 ベクトルの最大値を特定します。対応する命令は VGMAXPS です。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。
マスクなし extern _m512 __cdecl _mm512_gmax_ps(_m512 v2, _m512 v3); |
マスク付き extern _m512 __cdecl _mm512_gmask_max_ps(_m512 v1_old, __mmask16 k1, _m512 v2, _m512 v3); |
v2 |
最大値を特定する float32 ベクトル (1 つ目のソースオペランド) |
v3 |
最大値を特定する float32 ベクトル (2 つ目のソースオペランド) |
v1_old |
デスティネーション・ベクトルの古い値を保持するソースベクトル。マスクビットが 0 にセットされている場合は、v1_old の対応する要素が結果ベクトルにコピーされます。 |
k1 |
書き込みマスク。k1 マスクの対応するビットが '1' にセットされているソースベクトルの要素のみ計算され、結果に格納されます。k1 の対応するビットが 0 にセットされている結果ベクトルの要素は、ベクトル v1_old の要素からコピーされます。 |
float32 ベクトル v2 と float32 ベクトル v3 の対応する各要素ペアの最大値を特定します。
FpMax() は、一般に IEEE 規格に従って 2 つの float32 引数の大きい方を返します。以下は IEEE DX10 規格に従っています。
dest = src0 >= src1 ? src0 : src1
min(x,y) = x の場合に max(x,y) = y となるように、> の代わりに >= が使用されます。
NaN の特別な処理: ソースオペランドの 1 つが NaN の場合、もう一方のソースオペランドが返されます (選択はコンポーネントごとに行われます)。両方とも NaN の場合、1 つ目のソースオペランド (ここでは v2) のクワイエット型 NaN が返されます。 これは、新しい IEEE 754R 規格に準拠します。
マスク付きにはさらに引数 k1 があります。 ベクトルマスク k1 の対応するビットがセットされているソースレジスターの要素のみ計算に使用されます。
操作の結果。