概要: 自動並列化

インテル® C++ コンパイラの自動並列化機能は、入力プログラムのシーケンシャル部分を同等のマルチスレッド・コードに自動的に変換します。自動パラレライザは、プログラムのループのデータフローを分析して、安全かつ効率的に並列実行可能なループに対するマルチスレッド・コードを生成します。これにより、SMP (対称型マルチプロセッサ) システムの並列アーキテクチャを活用できます。

自動並列化は次のようなユーザの負担を軽減します:

並列ランタイム・サポートは、ループの反復修正、スレッド・スケジューリング、および同期化の詳細を処理するような、OpenMP* と同じランタイム機能を提供します。

OpenMP ディレクティブはシリアル・アプリケーションを素早く並列アプリケーションに変換することができますが、プログラマは、並列処理を含む適切なコンパイラ・ディレクティブを追加するアプリケーション・コードの特定部分を明示的に識別する必要があります。-parallel オプションで起動された自動並列化は、並列処理を含むループ構造を自動的に識別します。コンパイル中、コンパイラは、並列処理のためにコード・シーケンスを別々のスレッドに自動的に分解しようと試みます。他にプログラマにかかる負荷はありません。

次の例は、2 つのスレッドで同時に実行できるようにループの反復を分割する方法を示します。

オリジナルの連続コード

for (i=1; i<100; i++)

{

  a[i] = a[i] + b[i] * c[i];

}

変換された並列コード

/* Thread 1 */

for (i=1; i<50; i++)

{

  a[i] = a[i] + b[i] * c[i];

}

 

/* Thread 2 */

for (i=50; i<100; i++)

{

  a[i] = a[i] + b[i] * c[i];

}