<<

ファイル
    .dpi
       基本的な PGO オプション
       profmerge ユーティリティーと proforder ユーティリティー
       コード・カバレッジ・ツール
       テスト・プライオリタイゼーション・ツール
    .dyn
       基本的な PGO オプション
       プロファイル情報のダンプとリセット
       プロファイル情報のダンプ
       PGO の環境変数
       profmerge ユーティリティーと proforder ユーティリティー
       コード・カバレッジ・ツール
       テスト・プライオリタイゼーション・ツール
       アプリケーションのプロファイル
    .spi
       コード・カバレッジ・ツール
       テスト・プライオリタイゼーション・ツール
    OpenMP* ヘッダー
    pgopti.dpi
    pgopti.spi
    source
       効率的なコンパイル
       プロファイルに基づく最適化の例
    書式なし
    書式付き



プログラムループ
プログラム全体の解析
プロシージャー間の最適化
   効率的なコンパイル
   ユーザー関数のインライン展開の制御
   プロファイルに基づく最適化の概要
   最適化機構レポートの作成
プロセッサー
    オプションを使用した IA-32 アーキテクチャー・プロセッサーの指定
    オプションを使用した IA-64 アーキテクチャー・プロセッサーの指定
    オプションを使用したインテル(R) 64 アーキテクチャー・プロセッサーの指定
    最大限のパフォーマンスの達成
プロファイリング
    情報の生成
プロファイルによって最適化されたコード
   基本的な PGO オプション
   PGO API サポートの概要
プロファイルに基づく最適化
    API サポート
    インターバル・プロファイル・ダンプ
    オプション
    サポート
    データの順序設定の最適化
    フェーズ
    プロファイル情報のダンプ
    プロファイル情報のリセット
    使用モデル
    
    動的プロファイル・カウンターのリセット
    概要
    環境変数
    関数のグループ化の最適化
    関数の順序設定の最適化
    関数順序リストの最適化
プロファイル・データ
    ダンプ
       プロファイル情報のダンプ
       インターバル・プロファイル・ダンプ
    動的カウンターのリセット
プロファイル情報のダンプ
   プロファイル情報のダンプ
   インターバル・プロファイル・ダンプ



ベクトルコピー
ベクトル化
    オプション
       ベクトライザーのオプション
       並列処理の概要
    サポート
    プログラミングのガイドライン
       ベクトル化のプログラミングにおける主要ガイドライン
       ベクトル化の概要 (IA-32 アーキテクチャーのみ)
    ループ
       ループの構造
       プロファイルに基づく最適化の概要
    レポート
    
    概要
ベクトル化できないコピー
ベクトル化の変更



ポインター・エイリアシング



マスタースレッド
    データの複写
マルチスレッド・プログラム
   自動並列化の概要
   インテル(R) アーキテクチャーのコーディング・ガイドライン
   並列処理の概要
マルチスレッド化
   OpenMP* のサポート・ライブラリー
   自動並列化のプログラミング



メモリー
    アクセス
    レイアウト
    依存性
    割り当て
メモリー・エイリアシング
メモリー・ファイル・システム



ユーザー関数
   ユーザー関数のインライン展開の制御
   デベロッパーが指示するユーザー関数のインライン展開
ユーティリティー
    profmerge
    proforder



ライブラリー
   並列領域宣言子
   入出力性能の向上
   アプリケーションの時間測定
    libifcore.lib
    OpenMP* ランタイム・ルーチン
       OpenMP* ランタイム・ライブラリー・ルーチン
       インテル拡張ルーチン/関数
ライブラリー・ルーチン
    OpenMP* ランタイム・ルーチン
    インテル拡張
    スレッド数の制御
ライブラリー関数
ランタイムチェック
ランタイム・パフォーマンス
    低下
    向上



リセット
    プロファイル情報
    動的プロファイル・カウンター
リダクション変数の初期値
リトル・エンディアン - ビッグ・エンディアンの変換
リンクツール
    xild
       プロシージャー間の最適化 (IPO) の概要
       IPO オブジェクトからのライブラリーの作成
       IPO に関連するパフォーマンス問題
    xilibtool
    xilink
       プロシージャー間の最適化 (IPO) の概要
       IPO に関連するパフォーマンス問題



ルーチン
    OpenMP* ランタイム
    インテル拡張
    タイミング
ループ
   ループの構造
   ループカウントとループ分配
    アンチ依存性
    アンロール
       ループアンロール
       ループアンロールのサポート
    カウント
       ループカウントとループ分配
       ループアンロールのサポート
    コラプス
    フロー依存性
    ベクトル化
    リダクション
    並列化
       ループの並列化とベクトル化
       自動並列化のプログラミング
       並列処理の概要
    交換
       インテル(R) アーキテクチャーのコーディング・ガイドライン
       HLO の概要
       最適化手法の適用
       ランタイム・パフォーマンスの理解
    依存性
    出力依存性
    分配
       ループカウントとループ分配
       HLO の概要
    変換
       効率的なコンパイル
       HLO の概要
       ランタイム・パフォーマンスの理解
    手動変換
    構造
    独立性
    配列における使用
ループのフロー依存性
ループのリダクション
ループアンロール
    HLO 最適化機構の使用
       最適化機構レポートの作成
       HLO の概要
    サポート
    制約
ループ交換
ループ内でのベクトル化できる複数の型の混在



レコードバッファー
    効率的な使用
レコード構造体
    アライメント
レジスターの割り当て
レジスター割り当て
レポートの生成
    xi* ツールの使用
    コンパイラー・コマンドの使用



ロックルーチン



ワークシェアリング
   ワークシェアリング構造宣言子
   並列処理の概要
   自動並列化の概要
   OpenMP* 宣言子と節の概要
   並列領域宣言子
   並列およびワークシェアリング複合構造
    宣言子
       ワークシェアリング構造宣言子
       並列およびワークシェアリング複合構造



一般的なコンパイラー宣言子
   プリフェッチのサポート
   ループアンロールのサポート



並列およびワークシェアリング複合構造
並列プログラミング
   並列処理の概要
   アプリケーションの最適化の概要
並列処理
   OpenMP* によるプログラミング
   並列処理: 概要
   OpenMP* ランタイム・ライブラリー・ルーチン
   自動並列化の概要
    スレッドモデル
並列化
   並列化の概要
   ループの並列化とベクトル化
   自動並列化の概要
   自動並列化のプログラミング
    診断
並列化の特定
並列構造
並列領域
    ライブラリー・ルーチンの影響
    宣言子の定義
    宣言子の影響



中間結果
    メモリーの使用
中間表現 (IR)
   IPO の使用
   プロシージャー間の最適化 (IPO) の概要
中間言語スカラー最適化機構



仮引数
   入出力性能の向上
   配列の効率的な使用



作成
    DPI リスト
    マルチスレッド・アプリケーション
作業スレッド



使用
    EQUIVALENCE 文
    OpenMP*
    アプリケーションの時間測定
    ダイナミック・ライブラリー
    バッファリングを使用しない書き出し
    プロファイルに基づく最適化
    メモリー
    ワークシェアリング
    実行速度の遅い算術演算子
    暗黙的な DO ループ
    書式付きまたは書式なしファイル
    浮動小数点の変換
    組み込み関数
    自動並列化
       自動並列化の概要
       並列処理: 概要
    非反復的なワークシェアリング SECTIONS
使用規則




    OpenMP* の使用
    プロファイルに基づく最適化の使用
    プロファイル情報のダンプ
    ベクトル化
    ループの構造
    並列プログラムの開発
    自動並列化
例外
    デノーマル



保守性



倍精度
    数値
       OpenMP* ランタイム・ライブラリー・ルーチン
       ランタイム効率の向上
       インテル(R) アーキテクチャーのコーディング・ガイドライン



入出力
    パフォーマンス
    パフォーマンスの向上
    リスト
    解釈



共有されるスコーピング
共有スカラー
共有変数



内部サブプログラム



効率
   ランタイム効率の向上
   入出力性能の向上
    コンパイル
       効率的なコンパイル
       コンパイル処理の最適化の概要
    レコードバッファーの使用
    配列の使用
効率的なコンパイルのオプション
効率的な配列アクセス



動的プロファイルのカウンター
動的情報
   PGO の環境変数
   プロファイルに基づく最適化の概要
    スレッド
    ファイル
    プロファイル・カウンターのリセット
    プロファイル情報のダンプ
動的情報ファイル



単精度実数
   ランタイム効率の向上
   インテル(R) アーキテクチャーのコーディング・ガイドライン



受け渡し
    効率的な配列引数の受け渡し



可算ループの正しい使用
    正しい使用



同期化
   並列処理の概要
   自動並列化の概要
    構造



向上
    ランタイム・パフォーマンス
    入出力性能



命令レベルの並列処理



回避
    DO ループ内の不要な演算
    EQUIVALENCE 文
    実行速度の遅い算術演算子
    小さな整数データ項目
    混合算術式
    非効率的なデータ型



変換
    順序の変更
変数
    PGO 環境
    プライベート・スコーピング
    割り当てられるループ
    自動
    長さ
変更
    スレッド数
    ソフトウェアのパイプライン化
    ランタイム・ライブラリー・ルーチンの呼び出し
    ループアンロール



多次元配列
    効率的な使用



大規模プログラムのコンパイル



実行フロー
実行モード
実行環境ルーチン


>>