インテル® DAAL 2018 デベロッパー・ガイド

詳細

np 次元の n 特徴ベクトル X = { x1= (x11,…,x1p), ..., xn= (xn1,…,xnp) }、クラスラベルのベクトル y = (y1, … ,yn)、ここで yi {0, 1, ..., C - 1} は特徴ベクトル xi が属するクラス、C はクラスの数で、ランダムフォレスト分類器を作成します。

訓練段階

ランダムフォレスト分類器は、次のように計算された、不純度メトリックとして Gini 不純度メトリックを含むランダムフォレスト訓練のアルゴリズム・フレームワークに従います。



ここで、 は、i 番目のクラスが属するサブセット D の観測数の割合です。

予測段階

ランダムフォレスト分類器とベクトル x1, ..., xr で、これらのベクトルのラベルを計算します。指定された各クエリーベクトル xi について解くため、アルゴリズムはその木に応答する森の木の葉ノードを見つけます。森は、森の木の過半数が採択しているラベル y を選択します。

OOB (Out-of-bag) 誤差

ランダムフォレスト分類器は、ランダムフォレストの OOB (Out-of-bag) 誤差を計算するアルゴリズム・フレームワークに従います。ここで、すべての木の OOB 予測の合算およびランダムフォレストの OOB 誤差の計算は次のように行われます。

変数の重要度

ライブラリーは、Gini 係数を不純度メトリックとして使用し、Gini ImportanceMean Decrease Gini としても知られる Mean Decrease Impurity (MDI) 重要度を計算します。