インテル® DAAL 2018 デベロッパー・ガイド

バッチ処理

決定木分類は、「訓練と予測」 > 「分類」 > 「使用モデル」で説明されている一般的なワークフローに従います。

訓練

入力と出力の説明は、「訓練と予測」 > 「分類」 > 「使用モデル」を参照してください。共通の入力に加えて、決定木では事後枝刈りに使用する次の入力を指定できます。

入力 ID

入力

dataForPruning

枝刈りデータセットを含む m x p 数値テーブルのポインター。このテーブルは、NumericTable の派生クラスのオブジェクトです。

labelsForPruning

クラスラベルを含む m x 1 数値テーブルのポインター。このテーブルは、(PackedSymmetricMatrix および PackedTriangularMatrix を除く) NumericTable の派生クラスのオブジェクトです。

訓練段階での決定木分類器のパラメーターは次のとおりです。

パラメーター

デフォルト値

説明

algorithmFPType

float

アルゴリズムが中間計算に使用する浮動小数点の型。float または double を指定できます。

method

defaultDense

決定木分類により使用される計算メソッド。現在サポートしている唯一の訓練メソッドは、defaultDense メソッドです。

splitCriterion

infoGain

分割ノードの最良のテストを選択する分割基準。決定木で利用可能な分割基準は次のとおりです。

  • gini - Gini 係数
  • infoGain - 情報利得

pruning

reducedErrorPruning

事後枝刈りを実行するメソッド。利用可能なオプションは次のとおりです。

  • reducedErrorPruning - 誤差低減枝刈り。枝刈りを使用する場合、dataForPruning および labelsForPruning 入力を提供します。
  • none - 枝刈りを行いません。

maxTreeDepth

0

最大の木の深さ。0 は深さ無制限を意味します。任意の負でない数を指定します。

minObservationsInLeafNodes

1

葉ノードの最小観測数。正の数を指定します。

予測

入力と出力の説明は、「訓練と予測」 > 「分類」 > 「使用モデル」を参照してください。

予測段階での決定木分類器のパラメーターは次のとおりです。

パラメーター

デフォルト値

説明

algorithmFPType

float

アルゴリズムが中間計算に使用する浮動小数点の型。float または double を指定できます。

method

defaultDense

決定木分類により使用される計算メソッド。現在サポートしている唯一の訓練メソッドは、defaultDense メソッドです。

サンプル

C++: dt_cls_dense_batch.cpp

Java*: DTClsDenseBatch.java

Python*: dt_cls_dense_batch.py

関連情報