インテル® DAAL 2018 デベロッパー・ガイド

決定木

決定木は、特徴空間をハイパーキューブのセットに分割した後、各ハイパーキューブに単純モデルを適合します。単純モデルは予測モデルで、予測機能をすべて無視し、0-R や定数分類器としても知られる多数クラス (または回帰従属変数の平均) を予測します。

決定木の構造は、次の図のような木構造です。


決定木構造

テストは特徴空間の分割規則です。テストは特徴値に依存します。テストの結果はそれぞれ、テストと延びた枝の 1 つに関連付けられた適切なハイパーキューブを表します。テストが論理式 (例えば、f<c または f=c、ここで f は特徴および c は決定木の構成中に適用された定数) の場合、構成された決定木は二分木であるため、葉ノード以外のノードの枝は論理式の結果と一致する 2 つの枝 ('true' および 'false') になります。

予測は、木の根ノードで開始され、このノードで指定されたテストで機能をテストした後、指定された例のテストの結果に対応する木の枝に移動します。その後、新しいノードを根ノードとする部分木について、このプロセスが繰り返されます。最終的な結果は、葉ノードの単純モデルの予測です。

決定木は、ブースティング (詳細は、「ブースティング」を参照)、バギングおよびランダムフォレスト (詳細は、「分類と回帰」 > 「ランダムフォレスト」を参照) のような一般的な集団学習でしばしば使用されます。