インテル® C++ コンパイラー 15.0 ユーザー・リファレンス・ガイド
float32 ベクトルをロード/ブロードキャスト/変換します。対応する命令は VMOVAPS です。 この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。
マスクなし extern __m512 __cdecl _mm512_extload_ps(void const* mt, _MM_UPCONV_PS_ENUM conv, _MM_BROADCAST32_ENUM bc, int hint); |
マスク付き extern __m512 __cdecl _mm512_mask_extload_ps(__m512 v1_old, __mmask16 k1, void const* mt, _MM_UPCONV_PS_ENUM conv, _MM_BROADCAST32_ENUM bc, int hint); |
bc パラメーターに応じて、メモリーアドレス mt で 1 つの (bc=_MM_BROADCAST_1X16)、4 つの (bc=_MM_BROADCAST_4X16)、または 16 の (bc=_MM_BROADCAST32_NONE) 要素をロードし、float32 値に変換して、結果を float32 ベクトルで返します。メモリーから読み取る要素の種類とサイズは、conv パラメーターに依存します。
マスク付きには 2 つの追加の引数 (v1_old と k1) があります。ベクトルマスク k1 の対応するビットが 1 にセットされている要素のみ計算されます。k1 の対応するビットがクリアされている結果ベクトルの要素の値は、v1_old ベクトルから取得されます。
ロード/ブロードキャスト/変換操作の結果。