加算組み込み関数

次の SSSE3 命令を水平加算に使用します。

extern __m128i _mm_hadd_epi16 (__m128i a, __m128i b);

パックド符号付きワードを水平に加算します。

符号付き 16 ビット整数の配列として abr を解釈します。

for (i = 0; i < 4; i++) {

r[i] = a[2*i] + a[2i+1];

r[i+4] = b[2*i] + b[2*i+1];

}

 

extern __m128i _mm_hadd_epi32 (__m128i a, __m128i b);

パックド符号付きダブルワードを水平に加算します。

符号付き 32 ビット整数の配列として abr を解釈します。

for (i = 0; i < 2; i++) {

r[i] = a[2*i] + a[2i+1];

r[i+2] = b[2*i] + b[2*i+1];

}

 

extern __m128i _mm_hadds_epi16 (__m128i a, __m128i b);

パックド符号付きワードを符号付き飽和処理を使用して、水平に加算します。

符号付き 16 ビット整数の配列として abr を解釈します。

for (i = 0; i < 4; i++) {

r[i] = signed_saturate_to_word(a[2*i] + a[2i+1]);

r[i+4] = signed_saturate_to_word(b[2*i] + b[2*i+1]);

}

 

extern __m64 _mm_hadd_pi16 (__m64 a, __m64 b);

パックド符号付きワードを水平に加算します。

符号付き 16 ビット整数の配列として abr を解釈します。

for (i = 0; i < 2; i++) {

r[i] = a[2*i] + a[2i+1];

r[i+2] = b[2*i] + b[2*i+1];

}

 

extern __m64 _mm_hadd_pi32 (__m64 a, __m64 b);

パックド符号付きダブルワードを水平に加算します。

符号付き 32 ビット整数の配列として abr を解釈します。

r[0] = a[1] + a[0];

r[1] = b[1] + b[0];

 

extern __m64 _mm_hadds_pi16 (__m64 a, __m64 b);

パックド符号付きワードを符号付き飽和処理を使用して、水平に加算します。

符号付き 16 ビット整数の配列として abr を解釈します。

for (i = 0; i < 2; i++) {

r[i] = signed_saturate_to_word(a[2*i] + a[2i+1]);

r[i+2] = signed_saturate_to_word(b[2*i] + b[2*i+1]);

}