Yuta Hayashibe

ナイーブベイズ分類器

  • 入力XXに対して出力ラベルYYの確率を求めることを考える

  • argmaxY(YX)=argmaxYP(Y)P(XY)P(X)=argmaxYP(Y)P(XY)argmax_Y (Y|X) = argmax_Y \frac{P(Y)P(X|Y)}{P(X)} = argmax_Y P(Y)P(X|Y)を求める

    • ベイズの定理による式変形
  • P(Y)P(Y)は学習データ中の比率で計算できる

  • P(XY)P(X|Y)P(XY)=iNP(fiY)P(X|Y)=\prod_i^N P(f_i | Y )と仮定する

    • X=f1,f2,,xNX={f_1, f_2, \cdots, x_N}となる多次元変数と仮定
    • 素性fif_i間の依存関係は無く,独立と仮定(=ナイーブ)
  • ゼロ頻度問題の解決法

    1. スムージングして最尤推定
    2. 事前分布にディリクレ分布を用いてMAP推定
  • モデル

    • 多変数ベルヌーイモデル
    • 多項モデル