高度なハードウェア・レベル解析タイプは、定義済みの 3 つのビューポイントに関連付けられています。
解析が完了したら、[Hardware Issues (ハードウェア問題)] ビューポイントで収集したデータの検証を開始します。このビューポイントには、ハードウェア関連のパフォーマンス評価基準データが表示されます。各評価基準は、インテルの設計者により定義されたイベント比率で、それぞれ定義済みのしきい値があります。インテル(R) VTune(TM) Amplifier XE は、プログラムユニットの集合 (例えば関数) ごとに比率を解析します。この値がしきい値を超え、そのプログラムユニットの CPU 時間が収集に費やした CPU 時間の 5% を超えると、パフォーマンスの問題の可能性がある箇所として報告され、値がピンクでハイライトされます。
ハードウェア・イベントベース・サンプリング解析で提供されるパフォーマンス・データを解釈するには、次の操作を行います。
[Hardware Issues (ハードウェア問題)] ビューポイントで [Summary (サマリー)] タブをクリックして、[Summary (サマリー)] ウィンドウを表示します。最初のセクションは、アプリケーション実行全体のハードウェア関連評価基準のサマリー統計です。黄色の疑問符にカーソルを移動すると、評価基準の説明が表示されます。
上記の例では、Instruction Starvation (命令スタベーション) 評価基準にカーソルを合わせて、そのツールヒントを表示しています。Branch Mispredict (分岐予測ミス) 評価基準は、アプリケーション実行全体のパフォーマンス問題を示すピンクでハイライトされています。インテル(R) VTune(TM) Amplifier XE は、評価基準の下に検出したパフォーマンス問題の説明を表示します。説明が長い場合は、その一部だけが表示されます。その場合は、説明文にカーソルを合わせると全文が表示されます。
最適化前後の比較のベースラインとして、インテル(R) VTune(M) Amplifier XE により検出されたパフォーマンス問題を使用することができます。この場合、経過時間の値が重要になります。
プログラムユニットごとのパフォーマンス問題を表示するには、[Bottom-up (ボトムアップ)] ペインに切り替えます。各行には、プログラムユニットとその消費 CPU サイクルの割合が表示されます。CPU 時間が 5% を超えるプログラムユニットは、hotspot と見なされます。デフォルトでは、データは降順でソートされ、hotspot はリストの上部に表示されます。
[Bottom-up (ボトムアップ)] ペインの各行は、ハードウェア・パフォーマンス評価基準を示します。インテル(R) VTune(TM) Amplifier XE は、インテルの設計者により考案された式に基づいて評価基準を計算し、その評価基準の定義済みのしきい値と比較します。評価基準の値がしきい値を超え、プログラムユニットが hotspot である場合、インテル(R) VTune(TM) Amplifier XE はこの値をパフォーマンスに重大な影響を与えるものとしてピンクでハイライトします。ピンクの各セルにカーソルを合わせて、問題の説明と推奨される解決方法を確認してください。
以下の例では、アプリケーションの CPU 時間のほとんどを費やしている 3 つの主要な hotspot (grid_intersect、sphere_intersect、および grid_bounds_intersect) が検出されています。そして、この 3 つの関数のパフォーマンスに影響を与える 3 つのタイプのハードウェア問題 (CPI (リタイアした命令ごとのクロック数)、LLC Miss (最終レベルのキャッシュミス)、および Branch Mispredict (分岐予測ミス)) が検出されています。例えば、grid_bounds_intersect 関数の実行中に発生した LLC Miss (最終レベルのキャッシュミス) の処理では、CPU サイクルの約 10% (0.094) がデータの待機に費やされています。つまり、この hotspot 関数に注目して、メモリーアクセスを最適化することで、この関数のパフォーマンスが最大 10% も向上する可能性があります。
クリティカルな関数を特定したら、その関数をダブルクリックして [Source/Assembly (ソース/アセンブリー)] ウィンドウを開き、ソースコードを検証できます。[Source/Assembly (ソース/アセンブリー)] ウィンドウには、イベントデータが表示されます。ここでは、[Bottom-up (ボトムアップ)] ペインでパフォーマンスに重大な影響を与えるものと識別されたハードウェア評価基準に含まれるイベントに注目します。列をソートして必要なデータを左端に表示したり、必要なイベント列を [Data of Interest (特定のデータ)] として定義できます。インテル(R) VTune(TM) Amplifier XE は設定を保存し、毎回その設定で結果を開きます。
© 2010 Intel Corporation. 無断での引用、転載を禁じます。