BLAS
C/C++ 言語環境からの LAPACK、BLAS、CBLAS ルーチンの呼び出し
Fortran 95 インターフェイス、LAPACK および BLAS
OpenMP* によりスレッド化される関数と問題
C から呼び出し
Fortran 95 インターフェイス
OpenMP* によりスレッド化されるルーチン
C、LAPACK、BLAS、CBLAS の呼び出し
C/C++ での複素数型、インテル® MKL
C/C++、インテル® MKL 複素数型
CBLAS インターフェイス、使用
Eclipse* CDT
統合開発環境でインテル® MKL をリンクする場合の設定
Eclipse* IDE CDT でインテル® MKL をリンクする場合の設定
設定
統合開発環境でインテル® MKL をリンクする場合の設定
Eclipse* IDE CDT でインテル® MKL をリンクする場合の設定
Eclipse* CDT の設定
統合開発環境でインテル® MKL をリンクする場合の設定
Eclipse* IDE CDT でインテル® MKL をリンクする場合の設定
FFT インターフェイス
OpenMP* によりスレッド化される関数と問題
OpenMP* によりスレッド化される問題
FFTW インターフェイスのサポート
Fortran 95 インターフェイス・ライブラリー
HT テクノロジー、構成のヒント
ILP64 プログラミング、サポート
LAPACK
C/C++ 言語環境からの LAPACK、BLAS、CBLAS ルーチンの呼び出し
Fortran 95 インターフェイス、LAPACK および BLAS
OpenMP* によりスレッド化される関数と問題
コーディング手法
C インターフェイス、使用
C から呼び出し
Fortran 95 インターフェイス
OpenMP* によりスレッド化されるルーチン
圧縮ルーチンのパフォーマンス
LAPACK 用 C インターフェイス、使用
LINPACK ベンチマーク
mkl コンパイラー・オプションの使用
MPI
メッセージ・パッシング・インターフェイスとの相互作用
カスタム・メッセージ・パッシング・インターフェイスの使用
インテル® MKL の相互作用
カスタム、使用法
OpenMP* によりスレッド化される関数
OpenMP* によりスレッド化される問題
ScaLAPACK、リンク
SDL
インターフェイスとスレッドレイヤーの動的選択
シングル・ダイナミック・ライブラリーの使用
アーキテクチャーのサポート
アフィニティー・マスク
アライメント、例
インクルード・ファイル、インテル® MKL
インストール、確認
インターフェイス
Fortran 95 インターフェイス・ライブラリーのリンク
ILP64 インターフェイスと LP64 インターフェイスの使用
Fortran 95、ライブラリー
LP64 と ILP64、使用
インターフェイス・ライブラリー、リンク
インターフェイス・ライブラリーとモジュール、インテル® MKL
インテル® Distribution for LINPACK Benchmark
ヘテロジニアス
インテル® Distribution for LINPACK* Benchmark for Clusters
インテル® Distribution for LINPACK Benchmark のヘテロジニアス・サポート
ヘテロジニアスのサポート
インテル® MKL の verbose モード
インテル® Optimized High Performance Conjugate Gradient Benchmark
はじめに
概要
インテル® TBB によりスレッド化される関数
インテル® TBB、スレッド化される関数
インテル® ハイパースレッディング・テクノロジー、構成のヒント
カーネル、インテル® MKL、直接呼び出し
カスタム共有オブジェクト
カスタム共有オブジェクトのビルド
関数のリストの作成
関数名の指定
ビルド
関数のリストの作成
関数名の指定
クラスター FFT
クラスターフーリエ変換関数のパフォーマンスの管理
LAPACKE 関数での無効な入力チェックの管理
インテル® MKL クラスター・ソフトウェアとのリンク
パフォーマンスの管理
クラスターフーリエ変換関数のパフォーマンスの管理
LAPACKE 関数での無効な入力チェックの管理
リンク
環境変数
クラスターフーリエ変換関数のパフォーマンスの管理
LAPACKE 関数での無効な入力チェックの管理
クラスター・スパース・ソルバー、リンク
クラスター・ソフトウェア、インテル® MKL
クラスター・ソフトウェア、リンク
インテル® MKL クラスター・ソフトウェアとのリンク
クラスターのリンク例
コマンド
リンク例
コーディング
コーディングのヒント
コーディング手法
データのアライメント
パフォーマンスを向上させるための手法
コードサンプル、使用
コンパイラーのランタイム・ライブラリー、リンク
コンパイラー依存の関数
コンパイル、インテル® MKL のバージョン依存
サポート、テクニカル
サポートしているアーキテクチャー
システム・ライブラリー、リンク
シングル・ダイナミック・ライブラリー
インターフェイスとスレッドレイヤーの動的選択
シングル・ダイナミック・ライブラリーの使用
スレッド・ライブラリー、リンク
スレッドの安全性、インテル® MKL
スレッド数
OpenMP* 環境変数を使用したスレッド数の設定
MKL_DYNAMIC
OpenMP* スレッド数の設定
ランタイムの OpenMP* スレッド数の変更
スレッド数を設定する手法
OpenMP* 環境変数を使用した設定
インテル® MKL の選択、特定のケース
クラスター用の設定
ランタイムの変更
設定する手法
スレッド制御、インテル® MKL 固有
ディスパッチ、新しいインテル® アーキテクチャー、環境変数を使用した有効化
ディレクトリー構造
付録 C: 詳細なディレクトリー構造
上位ディレクトリー構造
詳細
上位
データのアライメント、例
テクニカルサポート
パフォーマンス
非正規化数の演算
マルチコア・パフォーマンスの管理
デノーマル数
マルチコア
非正規化数
パフォーマンス、インテル® MKL、固有のプロセッサーでの向上
パフォーマンスを向上させる、小さな行列
パフォーマンス向上、小さな行列
ベクトルマス
環境変数を使用したベクトルマスのデフォルトモードの設定
デフォルトモード、環境変数の設定
デフォルトモードを設定する環境変数
ヘッダーファイル、インテル® MKL
ヘテロジニアス
インテル® Distribution for LINPACK Benchmark の概要
インテル® Distribution for LINPACK Benchmark
ヘテロジニアス・クラスター
インテル® Distribution for LINPACK Benchmark のヘテロジニアス・サポート
インテル® Distribution for LINPACK* Benchmark for Clusters によるサポート
マルチコア・パフォーマンス
メッセージ・パッシング・インターフェイス
メッセージ・パッシング・インターフェイスとの相互作用
カスタム・メッセージ・パッシング・インターフェイスの使用
インテル® MKL の相互作用
カスタム、使用法
メモリー、高帯域、インテル® MKL での使用
メモリー管理
メモリー関数、再定義
メモリー関数名の変更
モジュール、Fortran 95
リンク
インターフェイス・ライブラリーのリンク
コンパイラーのランタイム・ライブラリーとのリンク
システム・ライブラリーのリンク
スレッド・ライブラリーのリンク
計算ライブラリーのリンク
インターフェイス・ライブラリー
コンパイラーのランタイム・ライブラリー
システム・ライブラリー
スレッド・ライブラリー
計算ライブラリー
リンク、Web ベースのアドバイザー
リンク、クイックスタート
リンクするライブラリー
リンクするライブラリーの選択
インターフェイス
システム・ライブラリー
スレッド化
ランタイム
計算
リンクツール、コマンドライン
リンク行の構文
リンク例
クラスターのリンク例
リンク例
クラスター・ソフトウェア
一般
レイヤー、インテル® MKL の構造
一貫した結果
環境変数
MKL_NUM_STRIPES
環境変数を使用したインテル® MKL の動作の管理
インテル® アーキテクチャーにおける命令セット固有のディスパッチ
クラスターフーリエ変換関数のパフォーマンスの管理
OpenMP* スレッド制御用のインテル® MKL 固有の環境変数
環境変数による関数ドメインの動作の管理
環境変数を設定するスクリプト
?gemm のスレッド化アルゴリズムの制御
インテル® MKL の動作の管理
インテル® アーキテクチャーのディスパッチの制御
クラスター FFT のパフォーマンスの管理
スレッド制御
関数ドメインの動作の管理
固有のアーキテクチャーおよびプログラミング・インターフェイス向けの設定
新しいアーキテクチャーのディスパッチの有効化
関数呼び出しの情報、出力する
規則、表記
計算ライブラリー、リンク
計算結果、一貫性
結果、一貫した、得る
結果、数値再現性、得る
言語インターフェイスのサポート
言語が混在したプログラミング
言語固有インターフェイス
言語固有インターフェイスとインテル® MKL の使用
インターフェイス・ライブラリーとモジュール
呼び出し
C/C++ コードで複素数を返す BLAS 関数の呼び出し
C/C++ 言語環境からの LAPACK、BLAS、CBLAS ルーチンの呼び出し
C から BLAS 関数
C から CBLAS インターフェイス
C から Fortran 形式のルーチン
C から複素 BLAS レベル 1 関数
C++ から複素 BLAS レベル 1 関数
構造
レイヤーモデルの概念
付録 C: 詳細なディレクトリー構造
上位ディレクトリー構造
モデル
詳細
上位
構文、リンク行
高帯域メモリー、インテル® MKL での使用
情報、関数呼び出し、出力する
条件付きコンパイル
新しいインテル® アーキテクチャーのディスパッチ、環境変数を使用した設定
数値再現性のある結果
直接呼び出し、インテル® MKL の計算カーネル
非正規化数、パフォーマンス
表記規則
不安定な出力、回避
並列パフォーマンス
並列処理、インテル® MKL
例、リンク
クラスターのリンク例
リンク例
クラスター・ソフトウェア
一般