ストリーミングSIMD拡張命令を使用してメモリを操作する場合は、できる限り、16バイトでアライメントされたデータで行ってください。
F32vec4 およびF64vec2 オブジェクトの各変数は、デフォルトで正しくアライメントされています。浮動小数点配列は自動的にはアライメントされないので注意してください。16バイトでアライメントするには、 __declspec を次のように使用します。
__declspec( align(16) ) float A[4];