OpenMP によるプログラミング
THREADPRIVATE ディレクティブ
ワークシェアリング構造ディレクティブ
同期化構造
並列/ワークシェアリング複合構造
COPYIN 節
THREADPRIVATE ディレクティブ
ワークシェアリング構造ディレクティブ
同期化構造
並列/ワークシェアリング複合構造
COPYIN 節
THREADPRIVATE ディレクティブ
ワークシェアリング構造ディレクティブ
並列/ワークシェアリング複合構造
COPYIN 節
THREADPRIVATE ディレクティブ
マルチファイル IPO の効果分析
最適化とデバッグ
実際のオブジェクト・ファイルの生成
OpenMP によるプログラミング
並列処理: 概要
プロファイルに基づく最適化の方法とその使用モデル
プロファイルに基づく最適化の例
インテル・アーキテクチャのコーディング・ガイドライン
インテルが提供するパフォーマンス分析ツールの使用
デフォルトのコンパイラの最適化
対象とするプロセッサの指定 (-tppn)
プロセッサ固有のランタイム・チェック (IA-32 システム)
プロセッサ固有の最適化 (IA-32 のみ)
プロセッサ固有の自動最適化 (IA-32のみ)
プロセッサ固有のランタイム・チェック (IA-32 システム)
プロセッサ固有の最適化 (IA-32 のみ)
プロセッサ固有の自動最適化 (IA-32のみ)
ループ本体の文
対象とするプロセッサの指定 (-tppn)
特定のプロセッサの最適化の概要
プリフェッチ
ループのアンロール (-unroll[n])
Vol II について
インテル・アーキテクチャのコーディング・ガイドライン
インテル・アーキテクチャのコーディング・ガイドライン
ランタイム効率の向上
入出力性能の向上
IPO オブジェクトからのライブラリの作成
xild を使用したマルチファイル IPO 実行ファイルの作成
アプリケーションの時間測定
インテル・アーキテクチャのコーディング・ガイドライン
インテルが提供するパフォーマンス分析ツールの使用
プロセッサ固有のランタイム・チェック (IA-32 システム)
プロセッサ固有の最適化 (IA-32 のみ)
プロセッサ固有の自動最適化 (IA-32のみ)
特定のプロセッサの最適化の概要
Itanium ベース・システムにおける組込み関数の使用
OpenMP による並列化の概要
ユーザ関数のインライン展開の制御
ライブラリ関数のインライン展開
関数のインライン展開の基準
最適化の範囲の制限
最適化機構レポートの作成
デバッグ・オプションの概要
並列化の概要
OpenMP、ディレクティブ形式、および診断でのコンパイル
高度な PGO オプション
自動並列化のしきい値制御と診断
データスコープ属性節の概要
ワークシェアリング構造ディレクティブ
並列領域ディレクティブ
OpenMP の環境変数
インテル拡張ルーチン
インテルが提供するパフォーマンス分析ツールの使用
ベクトル化のサポート
OpenMP によるプログラミング
OpenMP、ディレクティブ形式、および診断でのコンパイル
インテル拡張ルーチン
並列領域のデバッグ
プロファイルに基づく最適化の例
実際のオブジェクト・ファイルの生成
ベクトル化のサポート
ベクトル化の概要
OpenMP ディレクティブと節の概要
PGO の環境変数
ベクトライザのオプション
基本的な PGO オプション
高度な PGO オプション
実際のオブジェクト・ファイルの生成
アライメント・オプション
シンボルの可視属性オプション
スタック: 自動割り当てと確認
デフォルトのコンパイラの最適化
OpenMP のサポート・ライブラリ
自動並列化の概要
Itanium ベース・システムの浮動小数点演算の精度
浮動小数点演算の精度の概要
マルチスレッドのデバッグ
並列領域のデバッグ
OpenMP、ディレクティブ形式、および診断でのコンパイル
自動並列化: 有効、オプション、ディレクティブ、および環境変数
Itanium ベース・アプリケーションのパイプライン化
ループカウントとループ分配
並列処理: 概要