インテル® DAAL 2018 デベロッパー・ガイド
np 次元の n 特徴ベクトル X = { x1= (x11,…,x1p), ..., xn= (xn1,…,xnp) }、クラスラベルのベクトル y = (y1, … ,yn)、ここで yi∈ {0, 1, ..., C - 1} は特徴ベクトル xi が属するクラス、C はクラスの数で、ランダムフォレスト分類器を作成します。
ランダムフォレスト分類器は、次のように計算された、不純度メトリックとして Gini 不純度メトリックを含むランダムフォレスト訓練のアルゴリズム・フレームワークに従います。
ここで、 は、i 番目のクラスが属するサブセット D の観測数の割合です。
ランダムフォレスト分類器とベクトル x1, ..., xr で、これらのベクトルのラベルを計算します。指定された各クエリーベクトル xi について解くため、アルゴリズムはその木に応答する森の木の葉ノードを見つけます。森は、森の木の過半数が採択しているラベル y を選択します。
ランダムフォレスト分類器は、ランダムフォレストの OOB (Out-of-bag) 誤差を計算するアルゴリズム・フレームワークに従います。ここで、すべての木の OOB 予測の合算およびランダムフォレストの OOB 誤差の計算は次のように行われます。
ライブラリーは、Gini 係数を不純度メトリックとして使用し、Gini Importance や Mean Decrease Gini としても知られる Mean Decrease Impurity (MDI) 重要度を計算します。