インテル® C++ コンパイラー 15.0 ユーザー・リファレンス・ガイド
このトピックは、インテル® グラフィックス・テクノロジー向けのインテル® 64 アーキテクチャーと IA-32 アーキテクチャーにのみ適用されます。
メモリーアクセスに関して、次の点を考慮してください。
インテル® グラフィックス・テクノロジー上のスカラー・メモリー・アクセスは、ホスト CPU 上と比べると効率が悪いため、回避すべきです。
ベクトル化されたメモリーアクセスはかなり効率的です。
int や float のような 4 バイト要素のギャザー/スキャッター・メモリー・アクセスは、ターゲット上で効率的です。この場合、帯域幅は、ギャザー/スキャッター・メモリー操作で使用されるキャッシュラインの数にのみ依存します。 1 バイト/2 バイトの要素からなるベクトルのギャザー/スキャッター・メモリー操作は、1 命令シーケンスごとに読み取るデータ量が小さいため、比較的効率が悪くなります。ただし、十分なアライメント情報が利用できる場合、コンパイラーは、1 バイト/2 バイトの要素からなる、連続するベクトルの読み取りを効率良いブロック読み取りに変換することができます。
ほとんどの場合、グローバルメモリーを使用する 1 バイト/2 バイトの要素のギャザー/スキャッター操作を回避するため、ローカル配列やベクトル化された 4 バイトの変数へデータをあらかじめロードするなどして、連続する読み取りを行うべきです。
インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。 改訂 #20110804 |