インテル® C++ コンパイラの自動並列化機能は、入力プログラムのシーケンシャル部分を同等のマルチスレッド・コードに自動的に変換します。自動パラレライザは、プログラムのループのデータフローを分析して、安全かつ効率的に並列実行可能なループに対するマルチスレッド・コードを生成します。これにより、SMP (対称型マルチプロセッサ) システムの並列アーキテクチャを活用できます。
自動並列化は次のようなユーザの負担を軽減します:
並列ランタイム・サポートは、ループの反復修正、スレッド・スケジューリング、および同期化の詳細を処理するような、OpenMP* と同じランタイム機能を提供します。
OpenMP ディレクティブはシリアル・アプリケーションを素早く並列アプリケーションに変換することができますが、プログラマは、並列処理を含む適切なコンパイラ・ディレクティブを追加するアプリケーション・コードの特定部分を明示的に識別する必要があります。-parallel オプションで起動された自動並列化は、並列処理を含むループ構造を自動的に識別します。コンパイル中、コンパイラは、並列処理のためにコード・シーケンスを別々のスレッドに自動的に分解しようと試みます。他にプログラマにかかる負荷はありません。
次の例は、2 つのスレッドで同時に実行できるようにループの反復を分割する方法を示します。
for (i=1; i<100; i++) { a[i] = a[i] + b[i] * c[i]; } |
/* Thread 1 */ for (i=1; i<50; i++) { a[i] = a[i] + b[i] * c[i]; }
/* Thread 2 */ for (i=50; i<100; i++) { a[i] = a[i] + b[i] * c[i]; } |