インテル® MKL 11.1 Releaseリリースノート

このドキュメントでは、インテル® マス・カーネル・ライブラリー (インテル® MKL) 製品の新機能や重要な注意事項について説明します。

インテル® MKL の最新情報に関するオンラインリソースおよびドキュメントへのリンク(インテル社 Web サイト、英語) は次のとおりです。

ドキュメント、ヘルプ、コードサンプルへのリンクは、インテル® MKL 製品ページにあります。テクニカルサポートについては、インテル® MKL テクニカルサポート・フォーラムのインテル® MKL ナレッジベースの記事をご覧ください。

お使いのメールアドレスを使用して製品を登録してください。これにより、サポートフォーラムでは登録ユーザーとして認識され、また製品のアップデートが通知されます。製品登録時のメールアドレス情報の使用に関しては、インテルのオンライン・プライバシー通知の概要をご覧ください。

インテル® MKL 11.1 の新機能

条件付きの数値再現性アライメントされていないデータで条件付き数値再現性 (CNR) モードをサポート
ノードごとにプロセッサーの種類や搭載されているインテル® Xeon Phi™ コプロセッサーの数が異なるヘテロジニアス・クラスターで MP LINPACK をサポート
Windows* において、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャー・ベースのインテル® Xeon Phi™ コプロセッサーでコンパイラーによるオフロード支援と自動オフロード・プログラミング・モデルをサポート
OS X* において Clang コンパイラーをサポート
最新の AMD* システムにおいて CNR=AUTO モードのパフォーマンスが向上
BLAS:
- インテル® SSE4.2 以降対応のすべてのインテル® プロセッサーにおいて [S/D]GEMV のパフォーマンスが向上
- インテル® アドバンスト・ベクトル・エクステンション 2 (インテル® AVX2) において [D/Z]GEMM および倍精度のレベル 3 BLAS 関数を最適化
- インテル® アドバンスト・ベクトル・エクステンション (インテル® AVX) およびインテル® AVX2 において [Z/C]AXPY および [Z/C]DOT[U/C] を最適化
- インテル® MIC アーキテクチャーにおいて DTRMM のシーケンシャル・バージョンを最適化
- インテル® AVX2 において DAXPY をチューニング
LAPACK:
- 固有値のみ必要な場合、大きな次元で (S/D)SYRDB および (S/D)SYEV のパフォーマンスが向上
- M,N<10 のような小さなサイズで xGESVD のパフォーマンスが向上。
- インテル® Xeon Phi™ コプロセッサーへの自動オフロードモードにおいて、xGETRF とインテル® SMP Linpack のパフォーマンスが向上
VSL:
- 平均絶対偏差のサポートとサンプルの追加
- alpha=1 の場合のワイブル乱数ジェネレーター (RNG) のパフォーマンスが向上
- 外積および平均絶対偏差の行列において、次数 4 までのローデータおよび中央部の統計的総和をサポート
- S. Joe および F. Y. Kuo により設計された、最大 21,201 次元まで発生できるソボル QRNG の使用法を示す VSL サンプルを追加
- インテル® MIC アーキテクチャーにおいて SFMT19937 基本乱数ジェネレーター (BRNG) のパフォーマンスが向上
DFT:
- インテル® MIC アーキテクチャーにおいて倍精度の複素数-複素数変換のパフォーマンスが向上
- インテル® AVX2 において複素数-複素数 DFT を最適化
- インテル® Xeon® プロセッサー E5 v2 ファミリー (開発コード名: IvyTown) において 2次元の複素数-複素数 DFT を最適化
- インテル® Xeon® プロセッサー E5 ファミリー (インテル® AVX) およびインテル® AVX2 において GENE アプリケーション固有のワークロードでパフォーマンスが向上
- DFTI 計算関数のドキュメントのデータレイアウトが向上
- 大規模な実数-複素数 FFT のスケーリング
データ・フィッティング:
- インテル® Xeon® プロセッサーおよびインテル® MIC アーキテクチャーにおいて df?Interpolate1D および df?SearchCells1D 関数のパフォーマンスが向上
- インテル® MIC アーキテクチャー、インテル® Xeon® プロセッサー X5570、インテル® Xeon® プロセッサー E5-2690 において、線形および 3 次 Hermite/Bessel/Akima スプライン用 df?construct1d 関数のパフォーマンスが向上
転置
- 正方行列でインプレース転置のパフォーマンスが向上
インストール時間を短縮するためパッケージに含まれるインテル® MKL のサンプルとテストをアーカイブ
リンクツールおよびリンク・ライン・アドバイザー: Windows* でインテル® MIC アーキテクチャーをサポート
Microsoft* Visual Studio* 2008 サポート終了予定
Windows Server* 2012 で Visual Studio* 2012 のドキュメントを表示できない場合
Windows Server* 2012 で Visual Studio* 2012 のヘルプまたはドキュメントを表示できない場合、Microsoft* Internet Explorer* のセキュリティー設定を変更すると表示されるようになります。[ツール] > [インターネットオプション] > [セキュリティ] を選択して、[インターネット] ゾーンで [MIME スニッフィングを有効にする] および [アクティブスクリプト] を有効にします。

重要な注意事項:

インテル® MKL では、インストールするコンポーネントを選択できるようになりました。PGI* コンパイラー、Compaq* Visual Fortran コンパイラー、SP2DP インターフェイス、BLAS95 および LAPACK95 インターフェイス、クラスターサポート (ScaLAPACK および Cluster DFT)、インテル® MIC アーキテクチャーのサポートに必要なコンポーネントは、インストール時に明示的に選択しない限りインストールされません。
インテル® MKL クラスター・コンポーネント (ScaLAPACK および Cluster DFT) では、アライメントされていない CNR は利用できません。
BOOST/uBLAS および Java* でのインテル® MKL の使用例は、製品パッケージからは削除され、以下の記事からダウンロードすることができます。
- How to use Intel MKL with Java
- How to use Boost* uBLAS with Intel MKL
既知の問題:
- OS X* で、ユーザー・アプリケーションが libmkl_rt.so ライブラリーにリンクされており、インテル® MKL への最初の呼び出しを並列領域で行う場合、セグメンテーション違反や次のエラーによりクラッシュします。
  “malloc:*** error for object xxxxx: pointer being freed was not allocated *** set a breakpoint in malloc_error_break to debug” (malloc: *** オブジェクト xxxxx のエラー: 解放しようとしているポインターは割り当てられていません *** malloc_error_break にブレークポイントを設定してデバッグしてください)
  
  または
  
  “malloc:*** error for object xxxxx: double free !!!*** set a breakpoint in malloc_error_break to debug” (malloc: *** オブジェクト xxxxx のエラー: すでに解放されています!!! *** malloc_error_break にブレークポイントを設定してデバッグしてください)
  
  回避策: 並列領域の前にインテル® MKL を呼び出してください。
- インテル® MIC アーキテクチャーで SGEMM と DGEMM は、TRANSB が 'N' で、行列 B の右の境界がページ境界でアライメントされている場合、セグメンテーション違反となりクラッシュします。この問題は、B に追加のメモリーを割り当てることで回避できます。

製品の内容

インテル® マス・カーネル・ライブラリー (インテル® MKL) には、次の 2 つのインストール・パッケージがあります: IA-32 およびインテル® 64 アーキテクチャー向けのパッケージとオンライン・インストーラー。

テクニカルサポート

インストール時にインテル® ソフトウェア製品の登録を行わなかった場合は、インテル® ソフトウェア開発製品レジストレーション・センターで製品の登録を行ってください。登録を行うことで、サポートサービス期間中 (通常は 1 年間)、製品アップデートと新しいバージョンの入手を含む無償テクニカルサポートが提供されます。

インテル® ソフトウェア製品のテクニカルサポート、製品の更新、ユーザーフォーラム、FAQ、ヒントとトリック、その他のサポートについての情報は、http://www.intel.com/software/products/support/ (英語) を参照してください。

注:代理店がテクニカルサポートを提供している場合は、インテルではなく代理店にお問い合わせください。

FAQ、ヒントとトリック、その他のサポート情報を含む、インテル® MKL ライブラリーについての技術情報は、インテル® MKL フォーラム http://software.intel.com/en-us/forums/intel-math-kernel-library/ (英語) およびインテル® MKL ナレッジベース http://software.intel.com/en-us/articles/intel-mkl-kb/all/ (英語) を参照してください。

権利の帰属

エンド・ユーザー・ソフトウェア使用許諾契約書 (End User License Agreement) で言及されているように、製品のドキュメントおよび Web サイトの両方で完全なインテル製品名の表示 (例えば、"インテル® マス・カーネル・ライブラリー") とインテル® MKL ホームページ (http://www.intel.com/software/products/mkl (英語)) へのリンク/URL の提供を正確に行うことが最低限必要です。

インテル® MKL の一部の基となった BLAS の原版は http://www.netlib.org/blas/index.html (英語) から、

インテル® MKL の一部の基となった LAPACK の原版は http://www.netlib.org/lapack/index.html (英語) から入手できます。LAPACK の開発は、E. Anderson、Z. Bai、C. Bischof、S. Blackford、J. Demmel、J. Dongarra、J. Du Croz、A. Greenbaum、S. Hammarling、A. McKenney、D. Sorensen らによって行われました。LAPACK 用 FORTRAN 90/95 インターフェイスは、http://www.netlib.org/lapack95/index.html (英語) にある LAPACK95 パッケージと類似しています。すべてのインターフェイスは、純粋なプロシージャー用に提供されています。

インテル® MKL クラスター・エディションの一部の基となった ScaLAPACK の原版は http://www.netlib.org/scalapack/index.html (英語) から入手できます。ScaLAPACK の開発は、L. S. Blackford、J. Choi、A. Cleary、E. D'Azevedo、J. Demmel、I. Dhillon、J. Dongarra、S. Hammarling、G. Henry、A. Petitet、K. Stanley、D. Walker、R. C. Whaley らによって行われました。

インテル® MKL Extended Eigensolver の機能は、Feast Eigenvalue Solver 2.0 (http://www.ecs.umass.edu/~polizzi/feast/) をベースにしています。

インテル® MKL の PARDISO* (PARallel DIrect SOlver) の開発は、バーゼル大学のコンピューター・サイエンス学部 (http://www.unibas.ch (英語)) によって行われました。(http://www.pardiso-project.org (英語)) から入手できます。

本リリースのインテル® MKL の一部の FFT 関数は、カーネギーメロン大学からライセンスを受けて、SPIRAL ソフトウェア生成システム (http://www.spiral.net/ (英語)) によって生成されました。SPIRAL の開発は、Markus Püschel、José Moura、Jeremy Johnson、David Padua、Manuela Veloso、Bryan Singer、Jianxin Xiong、Franz Franchetti、Aca Gacic、Yevgen Voronenko、Kang Chen、Robert W. Johnson、Nick Rizzolo らによって行われました。

ライセンスの定義

本資料に掲載されている情報は、インテル製品の概要説明を目的としたものです。本資料は、明示されているか否かにかかわらず、また禁反言によるとよらずにかかわらず、いかなる知的財産権のライセンスも許諾するものではありません。製品に付属の売買契約書『Intel's Terms and Conditions of Sale』に規定されている場合を除き、インテルはいかなる責任を負うものではなく、またインテル製品の販売や使用に関する明示または黙示の保証 (特定目的への適合性、商品適格性、あらゆる特許権、著作権、その他知的財産権の非侵害性への保証を含む) に関してもいかなる責任も負いません。

「ミッション・クリティカルなアプリケーション」とは、インテル製品がその欠陥や故障によって、直接的または間接的に人身傷害や死亡事故が発生するようなアプリケーションを指します。そのようなミッション・クリティカルなアプリケーションのためにインテル製品を購入または使用する場合は、直接的か間接的かにかかわらず、あるいはインテル製品やそのいかなる部分の設計、製造、警告にインテルまたは委託業者の過失があったかどうかにかかわらず、製造物責任、人身傷害や死亡の請求を起因とするすべての賠償請求費用、損害、費用、合理的な弁護士費用をすべて補償し、インテルおよびその子会社、委託業者および関連会社、およびそれらの役員、経営幹部、従業員に何らの損害も与えないことに同意するものとします。

インテル製品は、予告なく仕様や説明が変更されることがあります。機能または命令の一覧で「留保」または「未定義」と記されているものがありますが、その「機能が存在しない」あるいは「性質が留保付である」という状態を設計の前提にしないでください。これらの項目は、インテルが将来のために留保しているものです。インテルが将来これらの項目を定義したことにより、衝突が生じたり互換性が失われたりしても、インテルは一切責任を負いません。この情報は予告なく変更されることがあります。この情報だけに基づいて設計を最終的なものとしないでください。

本書で説明されている製品には、エラッタと呼ばれる設計上の不具合が含まれている可能性があり、公表されている仕様とは異なる動作をする場合があります。現在確認済みのエラッタについては、インテルまでお問い合わせください。

最新の仕様をご希望の場合や製品をご注文の場合は、お近くのインテルの営業所または販売代理店にお問い合わせください。

本資料で紹介されている資料番号付きのドキュメントや、インテルのその他の資料を入手するには、1-800-548-4725 (アメリカ合衆国) までご連絡いただくか、インテルの Web サイトを参照してください。

インテル・プロセッサー・ナンバーはパフォーマンスの指標ではありません。プロセッサー・ナンバーは同一プロセッサー・ファミリー内の製品の機能を区別します。異なるプロセッサー・ファミリー間の機能の区別には用いません。詳細については、http://www.intel.co.jp/jp/products/processor_number/ を参照してください。

Intel、インテル、Intel ロゴは、アメリカ合衆国および / またはその他の国における Intel Corporation の商標です。

* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。

最適化に関する注意事項
インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® SSE2、インテル® SSE3、インテル® SSSE3 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。改訂 #20110804

最適化に関する注意事項

インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® SSE2、インテル® SSE3、インテル® SSSE3 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。

改訂 #20110804