< 目次

インテル® MKL 2017 デベロッパー・ガイド

インテル® ハイパースレッディング (HT) テクノロジーの使用

インテル® ハイパースレッディング・テクノロジー (インテル® HT テクノロジー) は、各スレッドが異なる演算を実行している場合、またはプロセッサー上に十分に活用されていないリソースがある場合に特に有効です。しかし、インテル® MKL は、このどちらにもあてはまりません。ライブラリーのスレッド化された部分が利用可能なリソースの大半を使用して効率的に実行され、各スレッドで同一の演算を行っているためです。インテル® HT テクノロジーを無効にすると、より高いパフォーマンスを得られることがあります。

インテル® HT テクノロジーを有効にして実行する場合、物理コアの数よりも少ないスレッド数で実行すると、特にパフォーマンスに影響があります。また、例えば、すべての物理コアに対して 2 つのスレッドがある場合、スレッド・スケジューラーは一部のコアに 2 つのスレッドを割り当て、ほかのコアを無視することがあります。インテル® コンパイラーの OpenMP ライブラリーを使用している場合、この状況を回避するために、デベロッパー・ガイドおよびリファレンスを参照して、スレッド・アフィニティー・インターフェイスの最適な設定を行ってください。インテル® MKL の場合、以下の設定を適用します。

set KMP_AFFINITY=granularity=fine,compact,1,0

インテル® TBB スレッディング・テクノロジーを使用してプログラムをスレッド化する場合のスレッド・アフィニティーの指定方法は、https://www.threadingbuildingblocks.org/documentation にある tbb::affinity_partitioner クラスの説明を参照してください。

最適化に関する注意事項

インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。

注意事項の改訂 #20110804