インテル® DAAL 2018 デベロッパー・ガイド

バッチ処理

アルゴリズムの入力

多変量外れ値検出アルゴリズムの入力は次のとおりです。入力 ID をパラメーターとして、アルゴリズムの入力を提供するメソッドに渡します。詳細は、「アルゴリズム」を参照してください。

入力 ID

入力

data

外れ値検出用データを含む n x p 数値テーブルのポインター。入力は、NumericTable の派生クラスのオブジェクトです。

location

平均ベクトルを含む 1 x p 数値テーブルのポインター。入力は、(PackedSymmetricMatrix および PackedTriangularMatrix を除く) NumericTable の派生クラスのオブジェクトです。

scatter

偏差ベクトルを含む 1 x p 数値テーブルのポインター。入力は、(PackedSymmetricMatrix および PackedTriangularMatrix を除く) NumericTable の派生クラスのオブジェクトです。

threshold

外れ値領域を定義する負でない数を含む 1 x p 数値テーブルのポインター。入力は、(PackedSymmetricMatrix および PackedTriangularMatrix を除く) NumericTable の派生クラスのオブジェクトです。

入力に locationscatterthreshold (の少なくとも 1 つ) が含まれない場合、ライブラリーは次のデフォルト値でこれらの項目を初期化します。
location

0.0 のセット

scatter

対角要素 1.0 および非対角要素 0.0 の数値テーブル

threshold

3.0

アルゴリズムのパラメーター

多変量外れ値検出アルゴリズムのパラメーターは次のとおりです。計算メソッド・パラメーター method に依存します。

パラメーター

method

デフォルト値

説明

algorithmFPType

defaultDense または baconDense

float

アルゴリズムが中間計算に使用する浮動小数点の型。float または double を指定できます。

method

適用不可

defaultDense

多変量外れ値検出に利用可能なメソッド。

  • defaultDense - パフォーマンス指向の計算メソッド。
  • 非推奨: baconDense - BACON (Blocked Adaptive Computationally-efficient Outlier Nominators) メソッド。

    これは古いメソッド (非推奨) で、将来のリリースで削除される予定です。代わりに bacon_outlier_detection::Batch アルゴリズムを使用してください。

非推奨:initializationProcedure

defaultDense

適用不可

これは古いパラメーター (非推奨) で、将来のリリースで削除される予定です。アルゴリズムを初期化するには、入力クラスにテーブルを使用します。

アルゴリズムの初期パラメーターを設定するプロシージャー。プロシージャーを定義するのは開発者の責任です。

初期化プロシージャーの入力オブジェクトは次のとおりです。

  • data - 多変量外れ値検出アルゴリズムの入力データを含むサイズ n x p の数値テーブル。

初期化プロシージャーの結果は次のとおりです。

  • location - 平均ベクトルを含むサイズ 1 x p の数値テーブル。
  • scatter - 分散共分散行列を含むサイズ p x p の数値テーブル。
  • threshold - 外れ値領域を定義する負でない数を含むサイズ 1 x 1 の数値テーブル。

このパラメーターを設定しない場合、ライブラリーは次のデフォルトの初期化を使用します。

  • location - 0.0
  • scatter - 対角要素 1.0 および非対角要素 0.0 の数値テーブル
  • threshold - 3.0

baconDense

baconMedian

初期化メソッド。次のいずれか。

  • baconMedian - 中央値ベースのメソッド。
  • defaultDense - マハラノビス距離ベースのメソッド。

非推奨:alpha

baconDense

0.05

これは古いパラメーター (非推奨) で、将来のリリースで削除される予定です。代わりに bacon_outlier_detection::Batch アルゴリズムを使用してください。

自由度 p の χ 2 分布の (1 - α) 四分位数を定義する片側確率。

推奨値: α/n (n は観測数)。

非推奨:accuracyThreshold

baconDense

0.005

これは古いパラメーター (非推奨) で、将来のリリースで削除される予定です。代わりに bacon_outlier_detection::Batch アルゴリズムを使用してください。

停止基準。基本サブセットのサイズがしきい値未満に変更された場合、アルゴリズムは終了します。

アルゴリズムの出力

多変量外れ値検出アルゴリズムは次の結果を計算します。結果 ID をパラメーターとして、アルゴリズムの結果にアクセスするメソッドに渡します。詳細は、「アルゴリズム」を参照してください。

結果 ID

結果

weights

0 と 1 の n x 1 数値テーブルのポインター。i 番目が 0 の場合、i 番目の特徴ベクトルが外れ値であることを示します。デフォルトでは、この結果は HomogenNumericTable クラスのオブジェクトですが、(CSRNumericTablePackedSymmetricMatrix、および PackedTriangularMatrix を除く) NumericTable の派生クラスのオブジェクトとして定義できます。

サンプル

C++:

Java*:

Python*:

関連情報