インテル® C++ コンパイラの自動並列化機能は、入力プログラムのシーケンシャル部分を同等のマルチ・スレッド・コードに自動的に変換します。自動パラレライザは、プログラムのループのデータフローを分析して、安全かつ効率的に並列実行可能なループに対するマルチスレッド・コードを生成します。これにより、SMP(対称型マルチプロセッサ)システムの並列アーキテクチャを活用できます。
自動並列化は次のようなユーザの負担を軽減します。
並列ランタイム・サポートは、ループの反復修正、スレッド・スケジューリング、および同期化の詳細を処理するような、OpenMP*と同じランタイム機能を提供します。
OpenMPディレクティブはシリアル・アプリケーションを素早く並列アプリケーションに変換できる一方、並列処理を含み、適切なコンパイラ・ディレクティブを追加するアプリケーション・コードの特定部分を、プログラマは明示的に識別する必要があります。-parallelオプションで起動された自動並列化は、並列処理を含むループ構造を自動的に識別します。コンパイル中、コンパイラは、並列処理のためにコード・シーケンスを別々のスレッドに自動的に分解しようと試みます。他にプログラマにかかる負荷はありません。
次の例は、2つのスレッドで同時に実行できるようにループの反復を分割する方法を示します。
for (i=1; i<100; i++) { a[i] = a[i] + b[i] * c[i]; } |
Thread 1 |
---|
for (i=1; i<50; i++) { a[i] = a[i] + b[i] * c[i]; } |
Thread 2 |
for (i=50; i<100; i++) { a[i] = a[i] + b[i] * c[i]; } |