インテル® DAAL 2017 デベロッパー・ガイド
ライブラリーは、多項式のナイーブベイズ分類器 [Renie03] を提供します。
J をクラス数とし、0,1,…,J-1 でインデックスを付けます。整数値特徴ベクトル xi= (xi1,…,xip), i=1,…,n は、スケールされた頻度を含みます。xik の値は k 番目の特徴がベクトル xi で観測された回数です (文書分類問題では、xik は文書 xi の単語でインデックスされた k の生起回数です)。データセット (n 文書のセット)、(x1,…,xn) で、ナイーブベイズ分類器を訓練します。
訓練段階は、これらのパラメーターの計算を含みます。
ここで、Njk はクラス j の特徴 k の生起回数、Nj はクラスのすべての特徴の総生起回数、αk パラメーターは特徴 k の仮定の生起回数 (例えば、αk=1)、α はすべての αk の合計です。
log(p(θj))。ここで、p(θj) は事前クラス推定です。
新しい特徴ベクトル xi が指定されると、分類器はベクトルが属するクラスを決定します。