-mkl コンパイラー・オプション
BLAS
C/C++ 言語環境からの LAPACK、BLAS、CBLAS ルーチンの呼び出し
Fortran 95 インターフェイス、LAPACK および BLAS
OpenMP* によりスレッド化される関数と問題
C から呼び出し
Fortran 95 インターフェイス
OpenMP* によりスレッド化されるルーチン
C、LAPACK、BLAS、CBLAS の呼び出し
C/C++ での複素数型、インテル® MKL
C/C++、インテル® MKL 複素数型
CBLAS インターフェイス、使用
Eclipse* CDT
統合開発環境でインテル® MKL をリンクする場合の設定
Eclipse* IDE CDT でインテル® MKL をリンクする場合の設定
設定
統合開発環境でインテル® MKL をリンクする場合の設定
Eclipse* IDE CDT でインテル® MKL をリンクする場合の設定
Eclipse* CDT の設定
統合開発環境でインテル® MKL をリンクする場合の設定
Eclipse* IDE CDT でインテル® MKL をリンクする場合の設定
FFT インターフェイス
OpenMP* によりスレッド化される関数と問題
高速フーリエ変換最適化基数
OpenMP* によりスレッド化される問題
最適化基数
FFTW インターフェイスのサポート
Fortran 95 インターフェイス・ライブラリー
HT テクノロジー、構成のヒント
ILP64 プログラミング、サポート
Intel® Optimized High Performance Conjugate Gradient Benchmark
はじめに
概要
Intel® Optimized MP LINPACK Benchmark for Clusters
インテル® Xeon Phi™ コプロセッサー用の使用モード
ヘテロジニアスのサポート
ヘテロジニアスな Intel® Optimized MP LINPACK Benchmark
Intel® Optimized MP LINPACK Benchmark の概要
ノード間ヘテロジニアスとノード内ヘテロジニアス
ハイブリッド・モード
LAPACK
C/C++ 言語環境からの LAPACK、BLAS、CBLAS ルーチンの呼び出し
Fortran 95 インターフェイス、LAPACK および BLAS
OpenMP* によりスレッド化される関数と問題
コーディング手法
C インターフェイス、使用
C から呼び出し
Fortran 95 インターフェイス
OpenMP* によりスレッド化されるルーチン
圧縮ルーチンのパフォーマンス
LAPACK 用 C インターフェイス、使用
LINPACK ベンチマーク
MPI
メッセージ・パッシング・インターフェイスとの相互作用
カスタム・メッセージ・パッシング・インターフェイスの使用
インテル® MKL の相互作用
カスタム、使用法
OpenMP* スレッド数
インテル® MIC アーキテクチャーでのインテル® MKL のスレッド化の動作
インテル® Xeon Phi™ コプロセッサーでのインテル® マス・カーネル・ライブラリー
OpenMP* によりスレッド化される関数
OpenMP* によりスレッド化される問題
ScaLAPACK、リンク
インテル® Xeon Phi™ コプロセッサーでの ScaLAPACK とクラスター FFT の使用
インテル® Xeon Phi™ コプロセッサー
ScaLAPACK、リンク
SDL
インターフェイスとスレッドレイヤーの動的選択
シングル・ダイナミック・ライブラリーの使用
アーキテクチャーのサポート
アフィニティー・マスク
アライメント、例
インクルード・ファイル、インテル® MKL
インストール、確認
インターフェイス
Fortran 95 インターフェイス・ライブラリーのリンク
ILP64 インターフェイスと LP64 インターフェイスの使用
Fortran 95、ライブラリー
LP64 と ILP64、使用
インターフェイス・ライブラリー、リンク
インターフェイス・ライブラリーとモジュール、インテル® MKL
インテル® MIC アーキテクチャー
インテル® Xeon Phi™ コプロセッサーでのインテル® MKL の使用
インテル® MKL の使用
コンパイラーによるオフロード支援用のリンク
インテル® Xeon Phi™ コプロセッサーでのパフォーマンスを向上する
コプロセッサーでのリンクの例、コンパイラーによるオフロード支援
パフォーマンスを向上する
インテル® MKL の verbose モード
インテル® Xeon Phi™ コプロセッサー
インテル® Xeon Phi™ コプロセッサーでのインテル® MKL の使用
インテル® Xeon Phi™ コプロセッサーでのパフォーマンスを向上する
インテル® MKL の使用
パフォーマンス向上のヒント
インテル® Xeon Phi™ コプロセッサーのネイティブモードでインテル® MKL を実行する
コンパイラーによるオフロード支援用のリンク
ネイティブモードでのインテル® マス・カーネル・ライブラリーの実行
リンク
インテル® Xeon Phi™ コプロセッサーへの計算のオフロード
1 つのアプリケーションでの自動オフロードとコンパイラーによるオフロード支援の使用
自動オフロード
インテル® Xeon Phi™ コプロセッサーでのインテル® MKL の使用
オフロード手法の互換性保持
自動
手法
コンパイラーによるオフロード支援の例
コンパイラーによる支援、例
インテル® ハイパースレッディング・テクノロジー、構成のヒント
インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャー
インテル® Xeon Phi™ コプロセッサー用の Intel® Optimized MP LINPACK Benchnmark の使用モード
Intel® Optimized MP LINPACK Benchmark for Clusters の使用法
インテル® TBB によりスレッド化される関数
インテル® TBB、スレッド化される関数
オフロード手法、互換性保持
カーネル、インテル® マス・カーネル・ライブラリー、直接呼び出し
カスタム共有オブジェクト
カスタム共有オブジェクトのビルド
関数のリストの作成
関数名の指定
ビルド
クラスター FFT
クラスターフーリエ変換関数のパフォーマンスの管理
パフォーマンスの管理
環境変数
クラスター FFT、リンク
インテル® MKL クラスター・ソフトウェアとのリンク
インテル® Xeon Phi™ コプロセッサー
クラスター・スパース・ソルバー、リンク
クラスター・ソフトウェア、インテル® MKL
クラスター・ソフトウェア、リンク
インテル® MKL クラスター・ソフトウェアとのリンク
コマンド
クラスター・ソフトウェア、リンク
インテル® Xeon Phi™ コプロセッサーでの ScaLAPACK とクラスター FFT の使用
クラスターのリンク例
インテル® Xeon Phi™ コプロセッサー
リンク例
コーディング
コーディングのヒント
コーディング手法
データのアライメント
パフォーマンスを向上させるための手法
コードサンプル、使用
コンパイラーによるオフロード支援
コンパイラーによるオフロード支援の例
例
コンパイラーのランタイム・ライブラリー、リンク
コンパイラー依存の関数
コンパイル、インテル® MKL のバージョン依存
サポート、テクニカル
サポートしているアーキテクチャー
システム・ライブラリー、リンク
シングル・ダイナミック・ライブラリー
シングル・ダイナミック・ライブラリー
スレッド・ライブラリー、リンク
スレッドの安全性、インテル® MKL
スレッド化コントロール、インテル® MKL 固有
スレッド数
OpenMP* 環境変数を使用したスレッド数の設定
MKL_DYNAMIC
コプロセッサーの OpenMP* スレッド数の設定
ランタイムの OpenMP* スレッド数の変更
スレッド数を設定する手法
OpenMP* 環境変数を使用した設定
インテル® MKL の選択、特定のケース
クラスター用の設定
ランタイムの変更
設定する手法
ディスパッチ、新しいインテル® アーキテクチャー、環境変数を使用した有効化
ディレクトリー構造
付録 C: 詳細なディレクトリー構造
上位ディレクトリー構造
詳細
上位
データのアライメント、例
テクニカルサポート
ネイティブ実行、インテル® Xeon Phi™ コプロセッサーでのインテル® マス・カーネル・ライブラリー
ノード間ヘテロジニアスとノード内ヘテロジニアス、Intel® Optimized MP LINPACK Benchmark for Clusters
パフォーマンス
インテル® Xeon Phi™ コプロセッサーでのパフォーマンスを向上する
非正規化数の演算
マルチコア・パフォーマンスの管理
インテル® MIC アーキテクチャー
デノーマル数
マルチコア
非正規化数
パフォーマンス、インテル® MKL、固有のプロセッサーでの向上
パフォーマンスを向上させる、小さな行列
パフォーマンス向上、小さな行列
ベクトルマス
環境変数を使用したベクトルマスのデフォルトモードの設定
デフォルトモード、環境変数の設定
デフォルトモードを設定する環境変数
ヘッダーファイル、インテル® MKL
ヘテロジニアス・クラスター
ヘテロジニアスな Intel® Optimized MP LINPACK Benchmark
Intel® Optimized MP LINPACK Benchmark for Clusters によるサポート
マルチコア・パフォーマンス
メッセージ・パッシング・インターフェイス
メッセージ・パッシング・インターフェイスとの相互作用
カスタム・メッセージ・パッシング・インターフェイスの使用
インテル® MKL の相互作用
カスタム、使用法
メモリー、高帯域、インテル® MKL での使用
メモリー管理
メモリー関数、再定義
メモリー関数名の変更
モジュール、Fortran 95
リンク
インターフェイス・ライブラリーのリンク
コンパイラーによるオフロード支援用のリンク
コンパイラーのランタイム・ライブラリーとのリンク
システム・ライブラリーのリンク
スレッド・ライブラリーのリンク
計算ライブラリーのリンク
インターフェイス・ライブラリー
インテル® Xeon Phi™ コプロセッサー
コンパイラーのランタイム・ライブラリー
システム・ライブラリー
スレッド・ライブラリー
計算ライブラリー
リンク、Web ベースのアドバイザー
リンク、クイックスタート
リンクするライブラリー
インターフェイス・ライブラリーのリンク
システム・ライブラリーのリンク
スレッド・ライブラリーのリンク
コンパイラーのランタイム・ライブラリーとのリンク
計算ライブラリーのリンク
インターフェイス
システム・ライブラリー
スレッド化
ランタイム
計算
リンクツール、コマンドライン
リンク行の構文
リンク例
クラスターのリンク例
リンク例
クラスター・ソフトウェア
一般
レイヤー、インテル® MKL の構造
一貫した結果
環境変数
インテル® アーキテクチャーにおける命令セット固有のディスパッチ
環境変数を使用したインテル® MKL の動作の管理
関数ドメインの動作の管理
インテル® アーキテクチャーのディスパッチの制御
インテル® マス・カーネル・ライブラリーの動作の管理
関数ドメインの動作の管理
新しいアーキテクチャーのディスパッチの有効化
環境変数、設定
関数呼び出しの情報、出力する
規則、表記
計算ライブラリー、リンク
計算結果、一貫性
結果、一貫した、得る
結果、数値再現性、得る
言語インターフェイスのサポート
言語が混在したプログラミング
言語固有インターフェイス
言語固有インターフェイスとインテル® MKL の使用
インターフェイス・ライブラリーとモジュール
呼び出し
C/C++ コードで複素数を返す BLAS 関数の呼び出し
C/C++ 言語環境からの LAPACK、BLAS、CBLAS ルーチンの呼び出し
C から BLAS 関数
C から CBLAS インターフェイス
C から Fortran 形式のルーチン
C から複素 BLAS レベル 1 関数
C++ から複素 BLAS レベル 1 関数
構造
レイヤーモデルの概念
付録 C: 詳細なディレクトリー構造
上位ディレクトリー構造
モデル
詳細
上位
構文、リンク行
高帯域メモリー、インテル® MKL での使用
自動オフロードモード、概念
情報、関数呼び出し、出力する
条件付きコンパイル
新しいインテル® アーキテクチャーのディスパッチ、環境変数を使用した設定
数値再現性のある結果
直接呼び出し、インテル® マス・カーネル・ライブラリーの計算カーネル
非正規化数、パフォーマンス
表記規則
不安定な出力、回避
並列パフォーマンス
並列処理、インテル® MKL
例、リンク
コンパイラーによるオフロード支援用のリンク
クラスターのリンク例
リンク例
インテル® Xeon Phi™ コプロセッサー
クラスター・ソフトウェア
一般