<<

vector always プラグマ
vector nontemporal プラグマ
vector プラグマ
VTune(TM) パフォーマンス・アナライザー
    profrun



xiar
   IPO に関連するパフォーマンス問題
   IPO オブジェクトからのライブラリーの作成
xild
   IPO に関連するパフォーマンス問題
   IPO オブジェクトからのライブラリーの作成
   プロシージャー間の最適化 (IPO) の概要
   マルチファイル IPO 実行ファイルの作成
    リンクオプション
xilib
xilibtool
xilink
   IPO に関連するパフォーマンス問題
   IPO オブジェクトからのライブラリーの作成
   プロシージャー間の最適化 (IPO) の概要
   マルチファイル IPO 実行ファイルの作成
    リンクオプション



アプリケーション
    OpenMP*
    コードカバレッジ
    パイプライン化
    ビジュアル・プレゼンテーション
    基本ブロック
アプリケーション・テスト
アプリケーション・テストの重要度付け
アプリケーションのパフォーマンス
アプリケーションの解析
   インテルが提供するパフォーマンス解析ツールの使用
   パフォーマンス拡張手法
   パフォーマンス手法の使用
    VTune(TM) パフォーマンス・アナライザー
    インテル(R) スレッド化ツール
    インテル(R) デバッガー
アプリケーションの最適化について
アプリケーションの特性
アライメント
   データのアライメントの理解
   ベクトル化の例
    手法
    
インストルメンテーション
    コンパイル
インストルメント済みコード
    フィードバック・コンパイル
    プログラム
    実行
    生成
インターバル・プロファイル・ダンプ
    開始
インテル(R) Celeron(R) D プロセッサー
インテル(R) Celeron(R) M プロセッサー
インテル(R) Core(TM) Duo プロセッサー
   自動で IA-32 アーキテクチャー・ベースのプロセッサーを対象にする
   対象とするプロセッサーの指定
インテル(R) Core(TM) Extreme プロセッサー
インテル(R) Core(TM) Quad プロセッサー
インテル(R) Core(TM) Solo プロセッサー
インテル(R) Itanium(R) 2 プロセッサー
インテル(R) Pentium(R) 4 プロセッサー
インテル(R) Pentium(R) II プロセッサー
インテル(R) Pentium(R) III プロセッサー
インテル(R) Pentium(R) Pro プロセッサー
インテル(R) Pentium(R) プロセッサー
インテル(R) Xeon(R) プロセッサー
インテル(R) スレッド化ツール
インテル(R) デバッガー
インテル(R) リンクツール
インテル(R) 拡張ルーチン
インテル(R) 拡張環境変数
インライン展開
   インライン関数の展開
   プロファイルに基づく最適化の概要
   ユーザーが指示するユーザー関数のインライン展開
   ユーザー関数のインライン展開の制御
    コンパイラーが指示
    デベロッパーが指示
    プリエンプション
エイリアス



ガイドライン
    プロファイルに基づく最適化
    ベクトル化
       ベクトル化のプログラミングにおける主要ガイドライン
       ベクトル化の概要
    自動並列化
クアッドコア インテル(R) Xeon(R) プロセッサー
クイック・リファレンス
   コンパイラー・レポートのクイック・リファレンス
   プロシージャー間の最適化 (IPO) のクイック・リファレンス
   自動最適化
    IPO オプション
    コンパイラー・レポート
    自動最適化
クラスター OpenMP*
コード・カバレッジ・ツール
    データのエクスポート
    構文
    動的カウンター
    配色
コードの除外
    コード・カバレッジ・ツール
コードレイアウト
コード生成
    ワークキューイング
コンパイラー・レポート
    ソフトウェアのパイプライン化
    プロシージャー間の最適化 (IPO)
    ベクトル化
    レポートの生成
    高レベルの最適化 (HLO)
コンパイラー・レポートのクイック・リファレンス
コンパイラーの最適化
   自動最適化
   自動最適化の概要
コンパイルのサンプル
コンパイル単位



サポート
    OpenMP*
    プリフェッチ
    ループのアンロール
    最適化
    並列ランタイム
サンプル
   OpenMP* サンプル
   PGO サンプル
   コンパイラーの最適化のサンプル
   サンプル
   ベクトル化のサンプル
   組み込み関数サンプル
    IPO サンプル
    OpenMP* サンプル
    PGO サンプル
    コード・カバレッジ・ツール
    コンパイラーの最適化のサンプル
    サンプル
    テスト・プライオリタイゼーション・ツール
    ベクトル化のサンプル
    場所
    組み込み関数サンプル
サンプルの場所
シンボルの可視属性
    指定
シンボルの可視属性 (Linux*)
シンボルの可視属性 (Mac OS*)
シンボルの可視属性の指定
スカラーのクリーンアップ反復処理
ストリーミング SIMD 拡張命令
スレッド
    スレッドのスリープ時間
    スレッドレベルの並列処理
    並列処理モデル
スレッド・アフィニティー
スレッドプール
ソフトウェアのパイプライン化
   SWP レポート
   並列処理の概要
    IA-64 アーキテクチャー・ベースのアプリケーション向け
    ループカウントの影響
    レポート
    最適化
ソフトウェアのパイプライン化 (SWP) レポート



タイミング
    OpenMP* ルーチン
ツール
ツールオプション
    profmerge
    proforder
    profrun
    コード・カバレッジ・ツール
テクニカル・アプリケーション
テスト・プライオリタイゼーション・ツール
    オプション
    使用方法
    要件
    
データのアライメント
   データのアライメント
   データのアライメントの理解
データのプリフェッチ
    最適化
データフロー解析
   自動並列化の概要
   並列処理の概要
データプリフェッチ
データ形式
    type
       ベクトル化の概要
       並列処理の概要
    アライメント
    パーティショニング
    プリフェッチ
       HLO の概要
       ループカウントとループ分配
    依存性
       IA-64 アーキテクチャー向けのパイプライン化
       自動並列化: しきい値制御と診断
    共有
    構造体
デュアルコア
デュアルコア インテル(R) Itanium(R) 2 プロセッサー 9000
デュアルコア インテル(R) Xeon(R) プロセッサー
デュアルコア・スレッド・アフィニティー
トポロジーマップ



ハイパースレッディング・テクノロジー
    スレッドプール
    並列ループ
ハイパフォーマンス
ハイパフォーマンスを目的としたプログラミング
パイプライン化
    IA-64 アーキテクチャー・ベースのアプリケーション向け
    ループカウントの影響
パックされた構造体
パフォーマンス・アナライザー
パフォーマンスの最適化
パフォーマンス拡張
ヒューリスティック
    ソフトウェアのパイプライン化への影響
       IA-64 アーキテクチャー向けのパイプライン化
       ループカウントとループ分配
    データ・プリフェッチへの影響
       プリフェッチのサポート
       ループカウントとループ分配
    関数のインライン展開
ファイル
    .dpi
       profmerge ユーティリティーと proforder ユーティリティー
       コード・カバレッジ・ツール
       テスト・プライオリタイゼーション・ツール
       基本的な PGO オプション
    .dyn
       PGO の環境変数
       profmerge ユーティリティーと proforder ユーティリティー
       アプリケーションのプロファイル
       コード・カバレッジ・ツール
       テスト・プライオリタイゼーション・ツール
       プロファイル情報のダンプ
       プロファイル情報のダンプとリセット
       基本的な PGO オプション
    .hpi
    .spi
       コード・カバレッジ・ツール
       テスト・プライオリタイゼーション・ツール
    .tb5
    OpenMP* ヘッダー
    pgopti.dpi
    pgopti.spi
    source
プラグマ
    capturedprivate
    ivdep
       ベクトル化のサポート - プラグマ
       言語サポートと宣言子
    novector
       ベクトル化のサポート - プラグマ
       言語サポートと宣言子
    optimization_level
    optimize
    restrict
    task
       インテルのワークキューイング・モデルの概要
       ワークキューイング・コード生成
       ワークキューイング構造
    taskq
       インテルのワークキューイング・モデルの概要
       ワークキューイング・コード生成
       ワークキューイング関数例
       ワークキューイング構造
    vector
       ベクトル化のサポート - プラグマ
       言語サポートと宣言子
    vector always
       ベクトル化のサポート - プラグマ
       言語サポートと宣言子
    vector nontemporal
       ベクトル化のサポート - プラグマ
       言語サポートと宣言子
    ベクトル化との併用
プラグマの解釈にインテルの解釈を使用する
プリロード
プログラムループ
プログラム全体の解析
プロシージャー間の最適化
   プロファイルに基づく最適化の概要
   ユーザー関数のインライン展開の制御
   最適化機構レポートの作成
プロセッサー
    オプションを使用した IA-32 アーキテクチャーの指定
    オプションを使用した Itanium(R) プロセッサーの指定
    手動ディスパッチ
プロファイリング
    情報の生成
プロファイル・データ
    ダンプ
       インターバル・プロファイル・ダンプ
       プロファイル情報のダンプ
    動的カウンターのリセット
プロファイルによって最適化されたコード
   PGO API サポートの概要
   基本的な PGO オプション
プロファイルに基づく最適化
    API サポート
    インターバル・プロファイル・ダンプ
    オプション
    サポート
    プロファイル情報のダンプ
    プロファイル情報のリセット
    概要
    環境変数
    動的プロファイル・カウンターのリセット
    
プロファイル情報のダンプ
   インターバル・プロファイル・ダンプ
   プロファイル情報のダンプ
ヘルパースレッドの最適化
ベクトルコピー
ベクトル化
    オプション
       ベクトライザーのオプション
       並列処理の概要
    プログラミングのガイドライン
       ベクトル化のプログラミングにおける主要ガイドライン
       ベクトル化の概要 (IA-32 アーキテクチャーのみ)
    ループ
       プロファイルに基づく最適化の概要
       ループの構造
    レポート
    概要
    
ベクトル化できないコピー


>>