インテル® MKL 2017 デベロッパー・ガイド
クラスターノード上で Intel® Optimized MP LINPACK Benchmark バイナリーを実行するには、次の操作を行います。
これらの命令は、インテル® 64 アーキテクチャーを仮定していますが、その他のアーキテクチャーにも適用可能です。これらの命令は、前世代のインテル® Core™ プロセッサーまたはそれ以上のインテル® プロセッサーに直接適用されます。IA-32 アーキテクチャー・プロセッサーおよび以前のインテル® 64 アーキテクチャー・プロセッサーの場合は、make コマンドの version パラメーターを省略します。IA-32 アーキテクチャー・プロセッサーの場合は、ディレクトリー名と arch パラメーター値の調整も行います。
インテル® MKL、インテル® MPI、インテル® コンパイラーに必要な環境変数をロードし、バイナリーをビルドします。
<親ディレクトリー>/bin/compilervars.sh intel64
<mpi ディレクトリー>/bin64/mpivars.sh
<mkl ディレクトリー>/bin/mklvars.sh intel64
make arch=intel64 version=offload
ディレクトリーを bin/intel64 に変更します。
cd <mkl ディレクトリー>/benchmarks/mp_linpack/bin/intel64
このディレクトリーには、次のファイルが含まれています。
xhpl - インテル® 64 アーキテクチャー・バイナリー。
HPL.dat - HPL 入力データセット。
小さなテスト実行用のバイナリーを実行します。
./xhpl
ホスト・プロセッサーのメモリーと一致するように、HPL.dat ファイルの 6 行目の Ns の値を次のように変更します。
16GB の場合: 12000 Ns
32GB の場合: 56000 Ns
64GB の場合: 83000 Ns
一般に、行列の格納に必要なメモリー量は、次のように計算できます (各種バッファーは含みません): 8 * N * N / (P * Q) バイト。N は問題サイズ、P と Q は HPL.dat のプロセスグリッドです。HPL ドキュメントではメモリーの 80% を使用する問題サイズを選択することを推奨していますが、さらに大きなサイズを選択できる場合もあります。
./xhpl
ハイブリッド・オフロード・バイナリーの実行については、「ハイブリッド・オフロード・バイナリーの実行」を参照してください。