ナイーブベイズ分類器
- 入力$X$に対して出力ラベル$Y$の確率を求めることを考える
- $argmax_Y (Y|X) = argmax_Y \frac{P(Y)P(X|Y)}{P(X)} = argmax_Y P(Y)P(X|Y)$を求める
- ベイズの定理による式変形
- $P(Y)$は学習データ中の比率で計算できる
-
$P(X|Y)$は$P(X|Y)=\prod_i^N P(f_i | Y )$と仮定する
- $X={f_1, f_2, \cdots, x_N}$となる多次元変数と仮定
- 素性$f_i$間の依存関係は無く,独立と仮定(=ナイーブ)
-
ゼロ頻度問題の解決法
- スムージングして最尤推定
- 事前分布にディリクレ分布を用いてMAP推定
- モデル
- 多変数ベルヌーイモデル
- 多項モデル
Links
- イーブベイズ分類器を頑張って丁寧に解説してみる
- 数式ベースの説明