インテル® C++ コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
自動並列化を有効にするには、[Q]parallel オプションを使用します。このオプションは、安全に並列実行できる並列ループを検出して、これらのループのマルチスレッド・コードを自動的に生成します。
このオプションを使用して、並列化を有効にするには、KMP_STACKSIZE 環境変数に十分なサイズを設定する必要があります。
このオプションを使用すると、互換マイクロプロセッサーおよびインテル製マイクロプロセッサーの両方で並列化が有効になります。実行ファイルは、互換マイクロプロセッサーよりもインテル製マイクロプロセッサーにおいてより優れたパフォーマンスが得られる可能性があります。また、並列化は、/arch (Windows*)、-m (Linux* および macOS*)、[Q]x などの特定のオプションによる影響を受けます。
自動並列化を使用するコマンド例は、次のとおりです。
Linux* 用の自動並列化コマンド |
---|
icc -c -parallel prog.cpp |
Windows* 用の自動並列化コマンド |
---|
icl /c /Qparallel prog.cpp |
macOS* 用の自動並列化コマンド |
---|
icc -c -parallel prog.cpp |
自動並列化では、2 つのプラグマ #pragma parallel と #pragma noparallel が使用されます。
自動並列化コンパイラー・プラグマは次のとおりです。
構文 |
---|
|
<prefix> は #pragma で、<prefix> の後にはプラグマがきます。次に例を示します。
構文 |
---|
|
#pragma parallel プラグマは、すぐ後のループで存在していると想定され、正常な自動並列化を妨げる依存を無視するようにコンパイラーに指示します。しかし、依存性が証明されると無視されません。さらに、parallel [always] は、ループの並列化がパフォーマンスを向上させる可能性を推定するコンパイラー・ヒューリスティックを無効にします。これにより、コンパイラーによって、並列化がパフォーマンスを向上しないと推定された場合でも、ループが並列化されます。#pragma parallel [always [assert]] など、ASSERT キーワードが追加されると、コンパイラーは、コンパイラーの解析とコストモデルはループが並列化できないことを示している旨のエラーレベルのアサーション・メッセージを生成します。
#pragma noparallel プラグマは自動並列化を無効にしています。