次の整数ベクトル組込み関数は、HT テクノロジ インテル® Pentium® 4 プロセッサ (SSE3 対応) 用に設計されたものです。
extern __m128i _mm_lddqu_si128(__m128i const *p);
128 ビットの値をロードします (アライメントが合っている必要はありません)。この組込み関数は、ほとんどの場合 movdqu よりもパフォーマンスが向上します。しかし、書き込まれた直後のメモリ値を読み取る場合は、movdqu よりもパフォーマンスが低下します。
r := *p;