<<

ガイドライン
    プロファイルに基づく最適化
    ベクトル化
       ベクトル化の概要
       ベクトル化のプログラミングにおける主要ガイドライン
    自動並列化



クイック・リファレンス
   プロシージャー間の最適化 (IPO) のクイック・リファレンス
   コンパイラー・レポートのクイック・リファレンス
   自動最適化
    IPO オプション
    PGO オプション
    コンパイラー・レポート
    自動最適化
クラスター OpenMP*



コンパイラーの最適化
   自動最適化
   自動最適化の概要
コンパイラー・レポート
    xi* ツールを使用して要求
    ソフトウェアのパイプライン化
    プロシージャー間の最適化 (IPO)
    ベクトル化
    レポートの生成
    高レベルの最適化 (HLO)
コンパイラー・レポートのクイック・リファレンス
コンパイル単位
コードの除外
    コード・カバレッジ・ツール
コードレイアウト
コード・カバレッジ・ツール
    データのエクスポート
    動的カウンター
    構文
    配色



サポート
    OpenMP*
    プリフェッチ
    並列ランタイム



シンボルの可視属性
    指定
シンボルの可視属性 (Linux*)
シンボルの可視属性 (Mac OS* X)
シンボルの可視属性の指定



ストリーミング SIMD 拡張命令
スレッド
    スレッドのスリープ時間
    スレッドレベルの並列処理
    並列処理モデル
スレッドプール
スレッド・アフィニティー
スレッド数の変更
    一覧表



ソフトウェアのパイプライン化
   並列処理の概要
   SWP レポート
    レポート
ソフトウェアのパイプライン化 (SWP) レポート



タイミング
    OpenMP* ルーチン



ツール
ツールオプション
    profmerge
    proforder
    コード・カバレッジ・ツール
    テスト・プライオリタイゼーション



テクニカル・アプリケーション
テスト・プライオリタイゼーション・ツール
    オプション
    
    要件



デュアルコア
デュアルコア・スレッド・アフィニティー
データのアライメント
   データのアライメント
   データのアライメントの理解
データのプリフェッチ
    最適化
データの順序設定の最適化
データフロー解析
   自動並列化の概要
   並列処理の概要
データプリフェッチ
データ形式
    type
       並列処理の概要
       ベクトル化の概要
    パーティショニング
    プリフェッチ
    依存性
    共有



トポロジーマップ



ハイパフォーマンス
ハイパフォーマンスを目的としたプログラミング
ハイパースレッディング・テクノロジー
    スレッドプール
    並列ループ



パイプライン化
パックされた構造体
パフォーマンスの最適化
パフォーマンス・アナライザー
パフォーマンス拡張



ヒューリスティック
    データ・プリフェッチへの影響
    関数のインライン展開



ファイル
    .dpi
       基本的な PGO オプション
       profmerge ユーティリティーと proforder ユーティリティー
       コード・カバレッジ・ツール
       テスト・プライオリタイゼーション・ツール
    .dyn
       基本的な PGO オプション
       プロファイル情報のダンプとリセット
       プロファイル情報のダンプ
       PGO の環境変数
       profmerge ユーティリティーと proforder ユーティリティー
       コード・カバレッジ・ツール
       テスト・プライオリタイゼーション・ツール
       アプリケーションのプロファイル
    .spi
       コード・カバレッジ・ツール
       テスト・プライオリタイゼーション・ツール
    OpenMP* ヘッダー
    pgopti.dpi
    pgopti.spi
    source



プライベート・データ
プラグマ
    capturedprivate
    ivdep
    novector
    restrict
    task
       インテルのワークキューイング・モデルの概要
       ワークキューイング構造
    taskq
       インテルのワークキューイング・モデルの概要
       ワークキューイング構造
       ワークキューイング関数例
    vector
    vector always
    vector nontemporal
    ベクトル化との併用
プログラムループ
プログラム全体の解析
プロシージャー間の最適化
   ユーザー関数のインライン展開の制御
   プロファイルに基づく最適化の概要
   最適化機構レポートの作成
プロセッサー
    オプションを使用した IA-32 アーキテクチャー・プロセッサーの指定
    オプションを使用した IA-64 アーキテクチャー・プロセッサーの指定
    オプションを使用したインテル(R) 64 アーキテクチャー・プロセッサーの指定
    手動ディスパッチ
プロファイリング
    情報の生成
プロファイルによって最適化されたコード
   基本的な PGO オプション
   PGO API サポートの概要
プロファイルに基づく最適化
    API サポート
    インターバル・プロファイル・ダンプ
    オプション
    サポート
    データの順序設定の最適化
    フェーズ
    プロファイル情報のダンプ
    プロファイル情報のリセット
    使用モデル
    
    動的プロファイル・カウンターのリセット
    概要
    環境変数
    関数のグループ化の最適化
    関数の順序設定の最適化
    関数順序リストの最適化
プロファイル・データ
    ダンプ
       プロファイル情報のダンプ
       インターバル・プロファイル・ダンプ
    動的カウンターのリセット
プロファイル情報のダンプ
   プロファイル情報のダンプ
   インターバル・プロファイル・ダンプ



ベクトル化
    オプション
       ベクトライザーのオプション
       並列処理の概要
    プログラミングのガイドライン
       ベクトル化のプログラミングにおける主要ガイドライン
       ベクトル化の概要 (IA-32 アーキテクチャーのみ)
    ループ
       ループの構造
       プロファイルに基づく最適化の概要
    レポート
    概要
ベクトル化できないコピー



マルチスレッド・プログラム
   自動並列化の概要
   並列処理の概要
マルチスレッド化
   OpenMP* のサポート・ライブラリー
   自動並列化のプログラミング



メモリー
    割り当て
メモリー・エイリアシング



ユーザー関数
   ユーザー関数のインライン展開の制御
   デベロッパーが指示するユーザー関数のインライン展開
ユーティリティー
    profmerge
    proforder



ライブラリー
    OpenMP* ランタイム・ルーチン
       OpenMP* ランタイム・ライブラリー・ルーチン
       インテル拡張ルーチン/関数
ライブラリー・ルーチン
    OpenMP* ランタイム・ルーチン
    インテル拡張
ライブラリー関数
ランタイムチェック



リセット
    プロファイル情報
    動的プロファイル・カウンター
リダクション
リンクツール
    xild
       プロシージャー間の最適化 (IPO) の概要
       IPO オブジェクトからのライブラリーの作成
       IPO に関連するパフォーマンス問題
    xilibtool
    xilink
       プロシージャー間の最適化 (IPO) の概要
       IPO に関連するパフォーマンス問題



ルーチン
    OpenMP* ランタイム
    インテル拡張
    タイミング
ループ
    アンチ依存性
    アンロール
    フロー依存性
    ベクトル化
    リダクション
    並列化
       ループの並列化とベクトル化
       自動並列化のプログラミング
       並列処理の概要
    交換
       HLO の概要
       最適化手法の適用
       ランタイム・パフォーマンスの理解
    依存性
    出力依存性
    分配
    変換
       HLO の概要
       ランタイム・パフォーマンスの理解
    手動変換
    構造
    独立性
ループのスケジューリング
ループのフロー依存性
ループのリダクション
ループアンロール
    HLO 最適化機構の使用
       最適化機構レポートの作成
       HLO の概要
    制約
ループ・スケジューリング
ループ交換
ループ内でのベクトル化できる複数の型の混在



レジスターの割り当て
レジスター割り当て
レポートの生成
    xi* ツールの使用
    コンパイラー・コマンドの使用



ロックルーチン



ワークキューイング
   インテルのワークキューイング・モデルの概要
   ワークキューイング関数例
   ワークキューイング構造
    関数例
ワークシェアリング
   並列処理の概要
   自動並列化の概要
   OpenMP* 宣言子と節の概要
   OpenMP* を使用したワークシェアリング (Windows*)
    OpenMP* の使用



一般的なコンパイラー宣言子



並列プログラミング
   並列処理の概要
   アプリケーションの最適化の概要
並列処理
   並列処理: 概要
   OpenMP* ランタイム・ライブラリー・ルーチン
   自動並列化の概要
    スレッドモデル
並列制御構造
並列化
   並列化の概要
   ループの並列化とベクトル化
   自動並列化の概要
   自動並列化のプログラミング
    診断
並列化の特定
並列領域



中間表現 (IR)
   IPO の使用
   プロシージャー間の最適化 (IPO) の概要
中間言語スカラー最適化機構



作成
    DPI リスト
作業スレッド


>>