インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス

_mm512_extloadunpacklo_ps/_mm512_mask_extloadunpacklo_ps

アライメントされていないダブルワード・ストリームの 64 バイトでアライメントされた下位の部分をロードし、マスクがセットされている要素をアンパックして、float32 ベクトルにストアします。対応する命令は VLOADUNPACKLD です。この組込み関数は、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャーにのみ適用されます。

構文

マスクなし

extern __m512 __cdecl _mm512_extloadunpacklo_ps(__m512 v1_old, void const* mt, _MM_UPCONV_PS_ENUM conv, int hint);

マスク付き

extern __m512 __cdecl _mm512_mask_extloadunpacklo_ps(__m512 v1_old, __mmask16 k1, void const* mt, _MM_UPCONV_PS_ENUM conv, int hint);

引数

v1_old

デスティネーション・ベクトルの初期値を含むソースベクトル

k1

書き込みマスク

mt

ロード元のメモリーアドレス

hint

プロセッサーにデータが非テンポラルでないことを示すヒント。0 または 1 を使用できます。それぞれの値の意味は次のとおりです。

  • _MM_HINT_NONE = 0
  • _MM_HINT_NT = 1 (ロードは非テンポラル)

conv

順方向変換の種類。次のいずれかになります。

  • _MM_UPCONV_PS_NONE - 変換なし
  • _MM_UPCONV_PS_FLOAT16 - sint8 => float32
  • _MM_UPCONV_PS_UINT8 - uint8 => float32
  • _MM_UPCONV_PS_SINT8 - sint8 => float32
  • _MM_UPCONV_PS_UINT16 - uint16 => float32
  • _MM_UPCONV_PS_SINT16 - sint16 => float32

説明

要素がアライメントされたアドレス mt で始まる、バイト/ワード/ダブルワード・ストリームの 64 バイトでアライメントされた下位の部分がロード、変換、拡張され、書き込みマスクがセットされている要素がダブルワードの結果ベクトルに格納されます。ダブルワード・ベクトルの初期値は v1_old ベクトルからコピーされます。 各ダブルワードは、結果ベクトルの対応するダブルワードにのみマップされ、結果ベクトルの書き込みマスクがセットされている要素はスキップされるため、書き込みマスクでセットされているビットの数が変換したダブルワード・ストリームの長さになります。

この関数は、ストリーム中の mt 以降の、64 バイトでアライメントされた最初のアドレスの前にある (つまり、現在の実装では、メモリーストリームの上位のキャッシュラインにある) 変換したダブルワードを転送します (存在する場合)。 ストリームのダブルワードにマップしない結果ベクトルの要素は変更されません (v1_old から取得されます)。

戻り値

ロード操作の結果。