インテル® DAAL 2018 デベロッパー・ガイド

詳細

次元 pn 特徴ベクトル x1= (x11,…,x1p), ..., xn= (xn1,…,xnp) のセット X で、根本的な分布に属さないベクトルを識別します (外れ値の正確な定義は [Ben05] を参照)。

単変量外れ値検出のアルゴリズムは、それぞれの特徴を個別に考慮します。単変量外れ値検出法はパラメトリックで、データセットの既知の根本的な分布配置を仮定し、観測が領域に属している場合に外れ値としてマークする外れ値領域を定義します。外れ値領域の定義は、仮定された根本的なデータ分布に結合されます。単変量外れ値検出の外れ値領域の例を次に示します。

ここで、mn および σn は指定されたデータセットについて計算された平均および標準偏差の (ロバスト) 推定、αn は信頼度係数です。g (n, αn) は領域の範囲を定義し、観測数に調整します。