[Summary (サマリー)] ウィンドウは、インテル(R) VTune(TM) Amplifier XE でパフォーマンス解析を行う場合に最初に確認します。このウィンドウを表示するには、結果タブで [Summary (サマリー)] サブタブをクリックします。
[Summary (サマリー)] ウィンドウは、アプリケーションの実行の全体的な統計を表示します。次の表は、[Summary (サマリー)] ウィンドウで提供されるデータの説明です。
項目 | 内容 | ビューポイント |
---|---|---|
結果サマリー | ||
CPI |
リタイアした命令ごとのクロック数イベント比率です。値がおよそ 0.75 の場合は優良で、 およそ 4 の場合は不良です。値が不良の場合は、命令を実行するために必要なサイクルより多くのサイクルが要求されています。この場合、コードを編集することで、プロセッサーで実行される命令の効率を向上してみてください。 |
ハードウェア・イベント・カウント、ハードウェア・イベントベース・サンプル・カウント、ライト hotspot、ハードウェア問題 |
CPU Time (CPU 時間) |
アプリケーションの実行に費やされたすべてのプロセッサーの合計時間です。プロセッサーに複数のコアがある場合は、それぞれのコアで費やされた時間も追加されます。例えば、アプリケーションを実行するためにコア 1 で 4 秒、コア 2 で 7 秒を費やした場合、CPU 時間は 11 秒になります。CPU 時間は経過時間よりも長くなることがあります。最大 CPU 時間は、経過時間×論理コア数です。 |
hotspot、CPU 使用率別 hotspot、スレッドのコンカレンシー別 hotspot、ライト hotspot 解析 |
Elapsed Time (経過時間) |
アプリケーションの実行時間です。アプリケーション終了時のウォールクロック時間 - アプリケーション開始時のウォールクロック時間で求められます。 |
スレッドのコンカレンシー別 hotspot、hotspot、CPU 使用率別 hotspot、ロックと待機、ハードウェア・イベント・カウント、ハードウェア・イベントベース・サンプル・カウント |
Frames (フレーム) |
アプリケーションで使用されたフレームの総数です。 |
すべてのビューポイント |
Overhead Time (オーバーヘッド時間) |
システム同期 API、インテル(R) スレッディング・ビルディング・ブロック (インテル(R) TBB)、OpenMP* などの既知の同期およびスレッド化ライブラリーのオーバーヘッドに費やされた CPU 時間です。 |
スレッドのコンカレンシー別 hotspot、hotspot、CPU 使用率別 hotspot |
Spin Time (スピン時間) |
CPU がビジー状態だった間の待機時間です。通常は、ソフトウェア・スレッドが待機中に、同期 API により CPU がポーリングされると発生します。ある程度のスピン時間であれば、スレッドのコンテキスト・スイッチを増加させるよりも良い場合があります。ただし、スピン時間が長すぎると、作業の生産性に影響します。 |
ロックと待機 |
Total Thread Count (スレッドの総数) |
実行中または実行可能なスレッドの総数です。 |
スレッドのコンカレンシー別 hotspot、hotspot、CPU 使用率別 hotspot、ロックと待機 |
Wait Count (待機カウント) |
アプリケーションでシステム待機 API が呼び出された回数です。 |
ロックと待機 |
Wait Time (待機時間) |
アプリケーションのスレッドが、同期待機や I/O 待機などのイベントが発生するまで待機に要した時間です。 |
ロックと待機 |
<Hardware event-based metrics> (<ハードウェア・イベントベースの評価基準>) |
ハードウェア関連のパフォーマンス問題 (メモリーアクセス問題やバンド幅問題など) を特定するのに使用される評価基準ごとのアプリケーション全体のパフォーマンスです。各評価基準は、ハードウェア・イベントの比率です。黄色の疑問符にカーソルを移動すると、評価基準の説明が表示されます。 |
ハードウェア問題 |
上位の hotspot 関数/待機オブジェクト |
||
<data table of the top hotspot functions/synchronization objects> (<上位の hotspot 関数/同期オブジェクトのデータテーブル>) |
パフォーマンスに重大な影響を与える関数/同期オブジェクトです。このリストに表示する hotspot 関数/同期オブジェクトの数と評価基準は、ビューポイントの設定ファイルで制御します。"[Others]" には、アプリケーションのその他すべての関数/同期オブジェクトの合計値が示されます。 |
hotspot、コンカレンシー、ロックと待機、ライト hotspot |
ハードウェア・イベント・サンプル |
||
<data table of PMU event types and event count> (<PMU イベントタイプとイベントカウントのデータテーブル>) |
イベントタイプのリストです。値が最も大きいものに注目してみてください。イベントの詳細は、「プロセッサー・イベントのリファレンス」を参照してください。 |
ハードウェア・イベント・カウント、ハードウェア・イベント・サンプル・カウント |
CPU 使用率ヒストグラム |
||
垂直バー |
バーにカーソルを移動すると、その数の論理 CPU を使用してアプリケーションを実行した場合の経過時間が表示されます。 例えば、アプリケーションが 7 つのスレッドを 1.5 秒実行し、イベントを待機してからさらに 1.5 秒実行した場合、 7 番目のノードの値は 1.5 + 1.5 = 3 秒になります。 チャートの最後のバーには + マークが付いていることがあります。これは、CPU 使用率が Over (高) のスレッドがほかにもあり、そのバーにはそれらのスレッドの合計時間が示されていることを表します。 |
hotspot、スレッドのコンカレンシー別 hotspot、ロックと待機 |
ターゲット |
ターゲットで利用可能な論理プロセッサーの数です。デフォルトでは、物理コアの数と同じです。この値を目標に、最適化を行ってみてください。 |
|
平均値 |
並列に実行される CPU 数の実行全体を通した平均値です。CPU 時間 ÷ 経過時間で求められます。 例えば、クアッドコア・マシンでアプリケーションが 2 つのコアを 1 秒使用し、そしてどのコアも使用しないで 1 秒待機してから、4 つすべてのコアを 1 秒使用した場合、使用された CPU 数の平均は (2 * 1 + 0 * 1 + 4 * 1) / (1 + 1 + 1) = 6 / 3 = 2 となります。 使用される CPU 数は、常に利用可能なコア数以下でなければなりません。システムでオーバーサブスクリプションが発生し、コア数を超えるスレッドが実行されると、使用される CPU 数はコア数と同じになります。 この値は、パフォーマンス測定のベースラインとして使用できます。この値がコア数に近いほど、パフォーマンスが良くなります。 |
|
使用率インジケーター・バー |
さまざまな使用率レベルが、同時実行されているスレッド数にどのようにマップされるかを示します。 |
|
スレッド・コンカレンシー・ヒストグラム |
||
ターゲット |
ターゲットで利用可能な論理プロセッサーの数です。デフォルトでは、物理コアの数と同じです。この値を目標に、最適化を行ってみてください。 |
スレッドのコンカレンシー別 hotspot、ロックと待機 |
平均値 |
並列に実行される CPU 数の実行全体を通した平均値です。CPU 時間 ÷ 経過時間で求められます。 例えば、クアッドコア・マシンでアプリケーションが 2 つのコアを 1 秒使用し、そしてどのコアも使用しないで 1 秒待機してから、4 つすべてのコアを 1 秒使用した場合、使用された CPU 数の平均は (2 * 1 + 0 * 1 + 4 * 1) / (1 + 1 + 1) = 6 / 3 = 2 となります。 使用される CPU 数は、常に利用可能なコア数以下でなければなりません。システムでオーバーサブスクリプションが発生し、コア数を超えるスレッドが実行されると、使用される CPU 数はコア数と同じになります。 この値は、パフォーマンス測定のベースラインとして使用できます。この値がコア数に近いほど、パフォーマンスが良くなります。 |
|
使用率インジケーター・バー |
さまざまな使用率レベルが、同時実行されているスレッド数にどのようにマップされるかを示します。 |
|
垂直バー |
バーにカーソルを移動すると、スレッドの同時実行にかかった経過時間が表示されます。 例えば、アプリケーションが 7 つのスレッドを 1.5 秒実行し、イベントを待機してからさらに 1.5 秒実行した場合、 7 番目のノードの値は 1.5 + 1.5 = 3 秒になります。 チャートの最後のバーには + マークが付いていることがあります。これは、CPU 使用率が Over (高) のスレッドがほかにもあり、そのバーにはそれらのスレッドの合計時間が示されていることを表します。 |
|
収集とプラットフォームの情報 |
||
Command Line (コマンドライン) |
ターゲット・アプリケーションのパスです。 |
すべてのビューポイント |
Frequency (周波数) |
収集に使用されたプロセッサーの周波数です。 |
すべてのビューポイント |
Logical CPU Count (論理 CPU の数) |
収集に使用されたマシンの論理 CPU の数です。 |
すべてのビューポイント |
Operating System (オペレーティング・システム) |
収集に使用されたオペレーティング・システムです。 |
すべてのビューポイント |
Computer Name (コンピューター名) |
収集に使用されたコンピューターの名前です。 |
すべてのビューポイント |
Result Size (結果サイズ) |
インテル(R) VTune(TM) Amplifier XE で収集された結果のサイズです。 |
すべてのビューポイント |
© 2010 Intel Corporation. 無断での引用、転載を禁じます。