インテル® DAAL 2017 デベロッパー・ガイド
特異値分解 (SVD) で最高のパフォーマンスを得るには、入力、出力、および補助データに、algorithmFPType クラス・テンプレート・パラメーターで指定した型と同じ型の同次数値テーブルを使用します。
オンライン処理モードの SVD は、少なくともバッチ処理モードと同程度に計算が複雑であり、compute() メソッドの呼び出し間で補助データを格納するためにメモリー要件が高くなります。その一方で、SVD のオンラインバージョンは、遅いデータソースからのデータ読み取りのレイテンシーを隠蔽できます。このためには、現在のブロックの compute() メソッドと並列に次のデータブロックのロード・プリフェッチを行います。
左特異ベクトルの行列が必要ない場合、オンライン処理はほとんどの SVD で役立ちます。この場合、補助データを格納するためのメモリー要件は O(p*n) から O(p*p*nblocks) に減ります。
分散処理モードで SVD を使用するには、マスターノードでローカルノードの p x p 数値テーブルを集約する必要があります。ローカルノードの作業量が少ない場合 (つまり、ローカルノードのデータセットが小さい場合)、ネットワーク・データ転送がボトルネックになります。この状況を回避するには、ローカルノードに十分な作業量があることを確認します。例えば、入力データセットを少数のノードに分散します。
最適化に関する注意事項 |
---|
インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。 注意事項の改訂 #20110804 |