インテル® DAAL 2018 デベロッパー・ガイド

詳細

以下の項目を指定します。

決定木分類器を作成します。

分割基準

ライブラリーは、分割基準 Gini 係数 [Breiman84] および情報利得 [Quinlan86]、[Mitchell97] に基づく決定木分類アルゴリズムを提供します。

  1. Gini 係数



    ここで、

    • D はノードが達する観測数のセットです。
    • piD のクラスで観測された観測数の割合です。

      Gini 係数を使用して最良のテストを見つけるため、次の式を使用して可能なテストを調査します。



      ここで、

      • O(τ) はテスト τ のすべての結果のセットです。
      • DvD のサブセットで、τ の出力は v です。例えば、

        ノードで使用するテストは のように選択されます。2 つの枝 ('true' および 'false') がある二分決定木では、 のようになります。

  2. 情報利得



    ここで、

    • O(τ)、DDv は上記で定義された値です。
    • pi は Gini 係数で定義された値です。

      Gini 係数と同様に、ノードで使用するテストは のように選択されます。2 つの枝 ('true' および 'false') がある二分決定木では、 のようになります。

訓練段階

分類決定木は、「分類と回帰」 > 「ランダムフォレスト」 > 「訓練段階」で説明されている決定木訓練のアルゴリズム・フレームワークに従います。

予測段階

分類決定木は、「分類と回帰」 > 「ランダムフォレスト」 > 「予測段階」で説明されている決定木予測のアルゴリズム・フレームワークに従います。

決定木とベクトル x1, …, xr で、これらのベクトルの応答を計算します。