インテル® MKL 2018 デベロッパー・ガイド

インテル® Distribution for LINPACK Benchmark の実行

複数のノード上でまたは 1 つのノード上で複数の MPI プロセスを使用してインテル® Distribution for LINPACK Benchmark を実行するには、MPI を使用するとともに、HPL.dat を変更するか、使いやすいコマンドライン・パラメーターを使用する必要があります。次の例は、スクリプトを使用して、動的にリンクされる事前ビルドされたインテル® Distribution for LINPACK Benchmark バイナリーを実行する方法を説明します。ほかのバイナリーを実行するには、必要に応じてステップを調整してください。

  1. インテル® MPI ライブラリーとインテル® コンパイラーに必要な環境変数をロードします。

    <親ディレクトリー>\bin\compilervars.bat intel64

    <mpi ディレクトリー>\bin64\mpivars.bat

  2. HPL.dat で問題サイズ N を 10000 に設定します。これはテスト実行用の設定であるため、問題サイズは小さくてかまいません。

  3. パフォーマンスを向上するため、システムで不均等メモリーアクセス (NUMA: Non-Uniform Memory Access) を有効にし、以下で説明するように、各 NUMA ソケットで MPI プロセスを実行するように設定します。

    第 2 世代インテル® Xeon Phi™ プロセッサーに搭載されている高帯域幅のマルチチャネル・ダイナミック・ランダム・アクセス・メモリー (MCDRAM) は、NUMA ノードと見なされることがあります。しかし、このノードには CPU がないため、MPI プロセスを実行しないでください。

    • システムで NUMA を有効にする方法については、BIOS 設定を参照してください。

    • クラスター構成に応じて、 runme_intel64_dynamic.bat スクリプトの一番上で次の変数を設定します。

      MPI_PROC_NUM
      MPI プロセスの総数。
      MPI_PER_NODE
      各クラスターノードあたりの MPI プロセスの数。
    • HPL.dat ファイルで、Ps * Qs が MPI プロセスの数と等しくなるように Ps パラメーターと Qs パラメーターを設定します。例えば、2 プロセスの場合、Ps を 1 に設定し、Qs を 2 に設定します。あるいは、HPL.dat ファイルを変更せずに、-p および -q コマンドライン・パラメーターを指定して起動します。

  4. runme_intel64_dynamic.bat スクリプトを実行します。

    runme_intel64_dynamic.bat

  5. 行列のサイズが利用可能なメモリーの約 80% を使用するようになるまで、問題サイズを徐々に大きくしてテストを再度実行します。サイズを変更するには、HPL.dat の行 6 で Ns の値を変更するか、-m コマンドライン・パラメーターを使用します。

    • 16GB の場合: 40000 Ns

    • 32 GB の場合: 56000 Ns

    • 64 GB の場合: 83000 Ns

最適化に関する注意事項

インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。

注意事項の改訂 #20110804

関連情報