インテル® DAAL 2018 デベロッパー・ガイド

バッチ処理

ランダムフォレスト分類および回帰は、「訓練と予測」 > 「分類」 > 「使用モデル」で説明されている一般的なワークフローに従います。

訓練

入力と出力の説明は、「訓練と予測」 > 「分類」 > 「使用モデル」を参照してください。

訓練段階での決定木回帰のパラメーターは次のとおりです。

パラメーター

デフォルト値

説明

seed

777

ブートストラップ・セットの選択、木のすべての分割ノードでの特徴の分割、MDA 変数の重要度の計算に必要な並べ替えの生成に使用される、乱数ジェネレーター用のシード。

nTrees

100

森の木の数。

observationsPerTreeFraction

1

単一木訓練のブートストラップ・セットの作成に使用される訓練セット S の割合。0 < observationsPerTreeFraction <= 1。観測数は置換でランダムにサンプリングされます。

featuresPerNode

0

ノードで分割を試す特徴の数。パラメーターが 0 に設定されている場合、ライブラリーは、分類には特徴の数の平方根、回帰には (特徴の数)/3 を使用します。

maxTreeDepth

0

最大の木の深さ。デフォルトは 0 (無制限) です。

minObservationsInLeafNodes

1 (分類) または 5 (回帰)

葉ノードの最小観測数。

impurityThreshold

0

停止基準として使用されるしきい値。ノードの不純度値がしきい値よりも小さい場合、ノードはそれ以上分割されません。

varImportance

none

変数の重要度計算モード。

設定可能な値は次のとおりです。

  • none – 変数の重要度は計算されません。
  • MDI - Gini Importance や Mean Decrease Gini としても知られる MDI (不純度減少の平均) を計算します。
  • MDA_Raw - MDA (精度減少の平均) を計算します (Permutation Importance)。
  • MDA_Scaled - MDA_Raw 値を標準偏差でスケールします。

resultsToCompute

0

計算するランダムフォレストの追加の特性を指定する 64 ビット整数のフラグ。以下の値の 1 つを提供して 1 つの特性を指定するか、ビット単位の OR を使用して特性の組み合わせを指定します。

  • computeOutOfBagError

出力

回帰または分類器の出力に加えて、ランダムフォレストは次の結果を計算します。結果 ID をパラメーターとして、アルゴリズムの結果にアクセスするメソッドに渡します。詳細は、「アルゴリズム」を参照してください。

結果 ID

結果

outOfBagError

計算された OOB (Out-of-bag) 誤差を含むサイズ 1 x 1 の数値テーブル (computeOutOfBagError オプションが有効な場合)。デフォルトでは、この結果は HomogenNumericTable クラスのオブジェクトですが、NumericTable の派生クラスのオブジェクトとして定義できます。

variableImportance

各特徴の変数の重要度値を含むサイズ 1 x p の数値テーブル。varImportance パラメーターを none に設定した場合、ライブラリーはテーブルに NULL ポインターを格納します。デフォルトでは、この結果は HomogenNumericTable クラスのオブジェクトですが、(PackedSymmetricMatrix および PackedTriangularMatrix を除く) NumericTable の派生クラスのオブジェクトとして定義できます。

関連情報