インテル® ソフトウェア製品のパフォーマンス / 最適化に関する詳細は、http://software.intel.com/en-us/articles/optimization-notice (英語) を参照してください。
Intel、インテル、Intel ロゴ、Intel Core、Xeon、VTune は、アメリカ合衆国および/ またはその他の国における Intel Corporation またはその子会社の商標です。
© 2020 Intel Corporation. 無断での引用、転載を禁じます。
製品詳細、その他ツールの
情報はこちらから
www.xlsoft.com/intel
セミナー開催情報は
こちらから
www.xlsoft.com/intel/seminar
www.xlsoft.com
03
マルチスレッドの利用や、メモリーの確保により発生する再現と原因の
特定が難しいエラーには、インテル® Inspector を使用します。メモリー
リーク、メモリー破壊、データ競合、デッドロックなどの潜在するエラー
の発生した箇所とタイミングをリスト形式で表示します。
Professional、Cluster Edition に同梱
メモリー / スレッドの不具合を動的に分析
インテル® Inspector
C/C++、 Fortran 言語に対応したインテル® コンパイラーは、インテル®
プロセッサーが持つ性能を最大限に引き出せるように、最適化された
バイナリーを生成します。インテル® プラットフォーム上で最新の C++
および Fortran の言語標準規格を実装可能であり、優れた最適化と
SIMD ベクトル化、 OpenMP* 5.0 並列プログラミング・モデルの活用
により、アプリケーションのパフォーマンスを向上できます。
全エディション
最新のインテル® プロセッサー向けに自動最適化
インテル® C++/Fortran コンパイラー
MPI-1.3、 MPI-2.2、 MPI-3.1 標準規格に準拠する、インテル® MPI
ライブラリーは、インテル® アーキテクチャー・ベースのクラスター向
けに最適化されています。Infiniband*、 Myrinet*、 iWARP、 TCP/IP
などの広範なインターコネクト・ファブリックに対応し通信のスループット
向上と、低遅延による高速化を支援します。
Cluster Edition に同梱
マルチファブリック対応の MPI を提供
インテル® MPI ライブラリー
MPI 通信を行うことで生じるパフォーマンスの問題は、インテル® Trace
Analyzer & Collector を使用して素早く特定することができます。MPI 関数
の動作状態をトレースし、プロセスごとの通信および計算に要した時間や、
呼び出し状況を時系列で表示できます。また、 MPI コードのデッドロック、
データ破壊、または MPI パラメーター、 データ型などのエラーを検出します。
Cluster Edition に同梱
MPI 通信の hotspot を特定し、高速化
インテル® Trace Analyzer & Collector
C/C++/Fortran コンパイラーによる自動最適化が行われなかった場合
は、インテル® Advisor を用いてソースコード中の最適化の余地を検
証し、ベクトル化、マルチスレッド化のアドバイスを得ることができます。
ベクトル化を安全かつ効率的に実装できるように、ループ処理の反復
回数、データ依存性、 メモリー・アクセス・パターンなどの有用な情報
を提供します。
Professional、Cluster Edition に同梱
スレッド化とベクトル化によりコードのパフォーマンスを向上
インテル® Advisor
インテル® Advisor のルーフライン解析は、ハードウェアが発揮できるパフォーマンスの
上限に対してソフトウェアの各処理がどの程度の効率で動作したか表示します。
パフォーマンス情報の収集には、インテル® VTune™ プロファイラーが
最適です。C/C++、 Fortran、 Python*、 Go*、 Java*、 OpenCL* および、
これらの言語が混在したコードの解析に対応しており、 CPU 時間を一番
消費している箇所を特定して、原因調査に必要な情報を可視化します。
また、MPI、 CPU、 FPU、 メモリーの使用状況を表示するパフォーマンス・
スナップショット機能を使用することで、コードの高速化の可能性を素早く
特定することができます。
Professional、Cluster Edition に同梱
パフォーマンスの問題となる原因を素早く特定
インテル® VTune™ プロファイラー
インテル® VTune™ プロファイラーの解析結果では、スレッドごとの動作状況をタイム
ラインで示し、実行された関数などに対するパフォーマンス特性を表示します。