インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
インテル® C++ コンパイラーと gcc コンパイラーにはいくつかの大きな違いがあります。インテル® C++ コンパイラーでソースコードをコンパイルする際は、次のことに注意してください。
インテル® C++ コンパイラーは、コンパイラーのバイナリー、ライブラリー、man ページ、ライセンスファイルの場所を環境変数から読み取ります。これらの環境変数は、gcc が使用する環境変数とは異なる場合があります。また、これらの変数はインテル® C++ コンパイラーをインストールしても、デフォルトで設定されません。インテル® C++ コンパイラーを実行する前に、次の環境変数を設定する必要があります。
PATH - コンパイラー・バイナリーの場所を PATH に追加します。
LD_LIBRARY_PATH - 生成されるバイナリーとリンクするランタイム・ライブラリー (*.so ファイル) の場所を設定します。
MANPATH - コンパイラーの man ページ (icc と icpc) の場所を MANPATH に追加します。
INTEL_LICENSE_FILE - インテル® C++ コンパイラーのライセンスファイルの場所を設定します。
これらの環境変数を設定するには、compilervars.sh スクリプトを実行します。
compilervars.sh を使用してこれらの環境変数を設定すると、gcc との競合が発生しません。同じシェルで両方のコンパイラーを使用することができます。
インテル® C++ コンパイラーは、インテル® アーキテクチャーで実行する際に、アプリケーションからより高いパフォーマンスを引き出すための最適化コンパイラーです。そのため、O2 オプションなどの特定の最適化は、インテル® C++ コンパイラーのデフォルトの起動の一部として実行されます。デフォルトでは、gcc* コンパイラーは最適化をオフにします。これは O0 でのコンパイルに相当します。次の表は、O<n> オプションの比較です。
オプション |
インテル® C++ コンパイラー |
gcc |
---|---|---|
-O0 |
最適化をオフにします。 |
デフォルト。最適化をオフにします。 |
-O1 |
速度がある程度向上し、コードサイズは減少します。 |
速度がある程度向上し、コードサイズは減少します。 |
-O2 |
デフォルト。コードサイズはある程度増加しますが、速度について最適化します。O オプションと同じです。組込み関数、ループアンロール、インライン展開が行われます。 |
コードサイズが増加しない限り、速度について最適化します。例えば、アンロールやインライン展開は行われません。 |
-O3 |
O2 オプションの最適化に加えて、プリフェッチ、スカラー置換、ループ変換、およびメモリーアクセス変換などのより強力な最適化を有効にします。 |
コードサイズは大きくなりますが、速度について最適化します。O2 オプションの最適化のほか、ループアンロール、インライン展開が行われます。インテル® C++ コンパイラーの O2 -ip オプションと似ています。 |
両コンパイラーで特定のプロセッサーを対象とする同様のオプションは多くありますが、インテル® コンパイラーには最新のプロセッサーを対象としたプロセッサー固有の命令スケジュールを利用するオプションが含まれています。gcc* アプリケーションを march オプションまたは mtune オプションでコンパイルする場合、IA-32 アーキテクチャーまたはインテル® 64 アーキテクチャーで実行されるアプリケーション向けのインテル® C++ コンパイラーの x オプションまたは ax オプションの使用を検討してください。
インテル® C++ コンパイラーでは、コンパイルの一環として設定ファイルと応答ファイルの管理が行われます。設定ファイルに格納されるオプションは、すべてのコンパイルに適用され、応答ファイルに格納されるオプションはコマンドラインに追加された場合に適用されます。各ビルドに適用される make ファイルにいくつかのオプションがある場合は、これらのオプションを設定ファイル (icc.cfg および icpc.cfg) に移動すると簡単です。
マルチユーザーのネットワーク環境では、icc.cfg ファイルと icpc.cfg ファイルにリストされているオプションは、通常、コンパイラーを使用するすべてのユーザーを対象としています。個別に設定する必要がある場合は、ICCCFG 環境変数または ICPCCFG 環境変数を使用して、/my_code/my_config.cfg などのように自分の .cfg ファイルの場所と名前を指定できます。コンパイラーに異なる設定ファイルを使用するように指示すると、常にシステムの設定ファイル (icc.cfg および icpc.cfg) は無視されます。
インテル® C++ コンパイラーは、よく使用される多くの関数の最適化された実装を含む追加ライブラリーを提供します。これらの関数の一部は、CPU ディスパッチを使用して実装されています。これは、さまざまなプロセッサーで実行されたときに異なるコードが実行されることを意味します。
提供されるライブラリーには、インテルの数学ライブラリー (libimf)、SVML (libsvml)、libirc などがあります。これらのライブラリーはデフォルトでリンクされます。sin や memset のような一部のライブラリー関数は、コンパイラーがコードをインライン展開するため、ライブラリーへの呼び出しが不要な場合もあります。
インテルの数学ライブラリー (libimf)
インテル® コンパイラーでは、デフォルトでインテルの数学ライブラリー (libimf) がリンクされます。sin などの関数の場合、コンパイラーですでに sin 関数の計算方法が認識されているため、このライブラリーへの呼び出しは不要です。インテルの数学ライブラリーには、標準の数学ライブラリーにはない関数も含まれています。
gcc では、インテルの数学ライブラリーの呼び出しは行えません。
libimf ライブラリーの多くのルーチンは、互換マイクロプロセッサーよりもインテル製マイクロプロセッサーでより高度に最適化されます。
SVML (Short Vector Mathematical Library) (libsvml)
ベクトル化が行われるとき、コンパイラーは libimf 数学ライブラリー関数への呼び出しを libsvml 関数に変換することがあります。これらの関数は、インテルの数学ライブラリーと同じ基本演算を実装しますが、ショートベクトルのオペランドで演算を行います。そのため、効率が向上します。場合によっては、libsvml 関数は、対応する libimf 関数より多少精度が低くなります。
libimf ライブラリーの多くのルーチンは、互換マイクロプロセッサーよりもインテル製マイクロプロセッサーでより高度に最適化されます。
libirc
libirc には、よく使用される文字列関数とメモリー関数の最適化された実装が含まれています。例えば、memcpy や memset の最適化されたバージョンがあります。memcpy および memset への呼び出しがあれば、コンパイラーは自動的にこれらの関数への呼び出しを生成します。また、コンパイラーは memcpy あるいは memset に相当するループをこれらの関数へ変換することもあります。
libirc ライブラリーの多くのルーチンは、互換マイクロプロセッサーよりもインテル製マイクロプロセッサーでより高度に最適化されます。
最適化に関する注意事項 |
---|
インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。 注意事項の改訂 #20110804 |