<<

マルチスレッド・プログラム
   自動並列化の概要
   並列処理の概要
マルチスレッド化
   OpenMP* のサポート・ライブラリー
   自動並列化のプログラミング
メモリー
    依存性
    割り当て
メモリー・エイリアシング



ユーザー関数
   デベロッパーが指示するユーザー関数のインライン展開
   ユーザー関数のインライン展開の制御
ユーティリティー
    profmerge
    proforder
    profrun



ライブラリー
    OpenMP* ランタイム・ルーチン
       OpenMP* ランタイム・ライブラリー・ルーチン
       インテル拡張ルーチン/関数
ライブラリー・ルーチン
    OpenMP* ランタイム・ルーチン
    インテル拡張
ライブラリー関数
ランタイムチェック
リセット
    プロファイル情報
    動的プロファイル・カウンター
リンクオプション
リンクツール
    xild
       IPO に関連するパフォーマンス問題
       IPO オブジェクトからのライブラリーの作成
       プロシージャー間の最適化 (IPO) の概要
       マルチファイル IPO 実行ファイルの作成
    xilibtool
    xilink
       IPO に関連するパフォーマンス問題
       プロシージャー間の最適化 (IPO) の概要
       マルチファイル IPO 実行ファイルの作成
ルーチン
    OpenMP* ランタイム
    インテル拡張
    タイミング
ループ
   ループの構造
   ループカウントとループ分配
    アンチ依存性
    アンロール
       ループのアンロール
       ループのアンロールのサポート
    カウント
       ループのアンロールのサポート
       ループカウントとループ分配
    フロー依存性
    ブロッキング
    ベクトル化
    リダクション
    依存性
    交換
       HLO の概要
       ランタイム・パフォーマンスの理解
       最適化手法の適用
    構造
    手動変換
    出力依存性
    独立性
    分配
       HLO の概要
       ループカウントとループ分配
    並列化
       ループの並列化とベクトル化
       自動並列化のプログラミング
       並列処理の概要
    変換
       HLO の概要
       ランタイム・パフォーマンスの理解
ループのアンロール
    HLO 最適化機構の使用
       HLO の概要
       最適化機構レポートの作成
    サポート
    制約
ループのフロー依存性
ループのリダクション
ループ交換
ループ内でのベクトル化できる複数の型の混在
レポートの生成
ロックルーチン



ワークキューイング
   インテルのワークキューイング・モデルの概要
   ワークキューイング・コード生成
   ワークキューイング関数例
   ワークキューイング構造
    コード生成
    関数例
ワークシェアリング
   OpenMP* 宣言子と節の概要
   自動並列化の概要
   並列処理の概要



一般的なコンパイラー宣言子
   プリフェッチのサポート
   ループのアンロールのサポート
引数のエイリアス化
可算ループ
    正しい使用
可算ループの正しい使用
解析
    データフロー
概要
    特定のプロセッサーの最適化
    並列処理
環境変数
    OpenMP*
    OpenMP* 拡張ルーチン
    PROF_DUMP_INTERVAL
    ルーチンの変更
    自動並列化
間違ってアライメントされたデータ
関数のプリエンプション
関数の展開
関数プリエンプション
関数順序リスト
関数分割
    有効化または無効化
擬似オブジェクト・ファイル
擬似コード
    並列処理モデル
共有スカラー
言語サポート
    __declspec
言語サポートのプラグマ
言語サポートの宣言子
構造
    for
    parallel
    section
    single
    task
    taskq
    複合
高レベルな最適化
高レベルな最適化機構
   HLO の概要
   最適化機構レポートの作成
高度な PGO オプション
差分カバレッジ
差分演算子
最適化
   アプリケーションの最適化について
   アプリケーションの最適化の概要
   最適化の制限
   自動最適化
    IA-32 アーキテクチャー向けのオプション
    IA-64 アーキテクチャー向けのオプション
    PGO 手法
    SSP
    アプリケーション
    アプリケーションの解析
    アプリケーション固有
    オプション
       異なるアプリケーション・タイプの最適化の概要
       自動最適化
        制限
        設定
    オペレーティング・システム関連
    コンパイラーの活用
    コンパイル処理
    サポート機能
    システム関連
    テクニカル・アプリケーション
    ハードウェア関連
    プロファイルに基づく
    ヘルパースレッド
    ライブラリー関連
    リソース
    レポート
       IA-64 アーキテクチャー向けのパイプライン化
       概要: 最適化サポート機能
       最適化機構レポートの作成
    概要
       アプリケーションの最適化について
       プロファイルに基づく最適化の概要
       自動最適化の概要
    高水準言語
    手法
    制限
    特定のプロセッサー
    並列化
    方法
最適化の拡張
最適化の手法
最適化の範囲の制限
   最適化の制限
   最適化の制限のサポート
最適化を無効
最適化サポート
最適化プラグマ
最適化機構レポートの生成
作業スレッド
作成
    DPI リスト
使用
    OpenMP*
    アプリケーションの時間測定
    ダイナミック・ライブラリー
    プロファイルに基づく最適化
    自動並列化
       自動並列化の概要
       並列処理: 概要
時間測定のサンプル
自動
    IA-32 アーキテクチャー・ベース・システム向けの最適化
自動パラレライザー
   自動並列化の概要
   並列処理: 概要
    制御
       自動並列化: しきい値制御と診断
       並列処理の概要
    有効
自動ベクトライザー
自動ベクトル化
自動最適化
   自動最適化
   自動最適化の概要
自動並列化
   自動並列化の概要
   並列処理の概要
    しきい値
    ガイドライン
    プログラミング
    概要
    環境変数
    診断
    有効
自動並列化されたループ
自動並列化のしきい値
実行フロー
実行モード
実行環境ルーチン
手動ディスパッチ
    cpu_dispatch
    cpu_specific
手動変換
条件
    関数のインライン展開
診断
   ベクトル化プログラミングの基本となるガイドライン
   並列処理: 概要
    自動パラレライザー
       自動並列化: しきい値制御と診断
       並列処理の概要
診断レポート
制御
    インライン展開
    自動並列化の診断
       自動並列化: しきい値制御と診断
       並列処理の概要
生成
    インストルメント済みコード
    プロセッサー固有のコード
    プロファイルによって最適化された実行ファイル
    プロファイル情報
    レポート

    一覧表
専用コード
   プロセッサー固有の自動最適化 (IA-32 アーキテクチャーのみ)
   並列処理の概要
組み込み関数
対象
   自動で Itanium(R) プロセッサーを対象にする
   手動で IA-32 アーキテクチャー・ベースのプロセッサーを対象にする
   対象とするプロセッサーの指定
    IA-32 アーキテクチャー
    IA-32 アーキテクチャー・プロセッサー
    Itanium プロセッサー
       自動で Itanium(R) プロセッサーを対象にする
       対象とするプロセッサーの指定#Processors2
    インテル(R) 64 アーキテクチャー・プロセッサー
    インテル(R) Core(TM) Duo プロセッサー
    インテル(R) Core(TM) Extreme プロセッサー
    インテル(R) Core(TM) Quad プロセッサー
    インテル(R) Core(TM) Solo プロセッサー
    インテル(R) Itanium(R) 2 プロセッサー
    インテル(R) Pentium(R) 4 プロセッサー
    インテル(R) Pentium(R) II プロセッサー
    インテル(R) Pentium(R) III プロセッサー
    インテル(R) Pentium(R) Pro プロセッサー
    インテル(R) Pentium(R) プロセッサー
    インテル(R) Xeon(R) プロセッサー
    クアッドコア インテル(R) Xeon(R) プロセッサー
    デュアルコア インテル(R) Itanium(R) 2 プロセッサー 9000
    デュアルコア インテル(R) Xeon(R) プロセッサー
    ランタイムチェック
    手動で対象にする
    手動ディスパッチ
大規模プログラムのコンパイル
中間言語スカラー最適化機構
中間表現 (IR)
   IPO の使用
   プロシージャー間の最適化 (IPO) の概要
動的プロファイルのカウンター
動的情報
   PGO の環境変数
   プロファイルに基づく最適化の概要
    スレッド
    ファイル
    プロファイル・カウンターのリセット
    プロファイル情報のダンプ
動的情報ファイル
同期化
   自動並列化の概要
   並列処理の概要
配列
    ベクトル化におけるアライメント
倍精度
    数値
非ユニット・メモリー・アクセス
並列プログラミング
   アプリケーションの最適化の概要
   並列処理の概要
並列化
   ループの並列化とベクトル化
   自動並列化のプログラミング
   自動並列化の概要
   並列化の概要
    診断
並列化の特定
並列処理
   OpenMP* ランタイム・ライブラリー・ルーチン
   自動並列化の概要
   並列処理: 概要
    スレッドモデル
並列制御構造
並列領域
変換
    順序の変更
変更
    ソフトウェアのパイプライン化
    ランタイム・ライブラリー・ルーチンの呼び出し
    ループのアンロール
変数
    PGO 環境
無効
    インライン展開
    プラグマによる最適化
    関数分割
命令レベルの並列処理
有効
    PGO オプション
    インライン展開
    パラレライザー
    自動パラレライザー

    OpenMP* の使用
    プロファイルに基づく最適化の使用
    プロファイル情報のダンプ
    ベクトル化
    ループの構造
    自動並列化
    並列プログラムの開発