Yuta Hayashibe
プロフィール
研究発表
データ
ソフトウェア
技術情報
MeCab
CaboCha
JUMAN
コーパス
文字コード
その他ツール
研究ノート
述語項構造解析
機械学習
音声言語処理
研究ノート
機械学習
分類
ナイーブベイズ分類器
ナイーブベイズ分類器
入力
X
X
X
に対して出力ラベル
Y
Y
Y
の確率を求めることを考える
a
r
g
m
a
x
Y
(
Y
∣
X
)
=
a
r
g
m
a
x
Y
P
(
Y
)
P
(
X
∣
Y
)
P
(
X
)
=
a
r
g
m
a
x
Y
P
(
Y
)
P
(
X
∣
Y
)
argmax_Y (Y|X) = argmax_Y \frac{P(Y)P(X|Y)}{P(X)} = argmax_Y P(Y)P(X|Y)
a
r
g
m
a
x
Y
(
Y
∣
X
)
=
a
r
g
m
a
x
Y
P
(
X
)
P
(
Y
)
P
(
X
∣
Y
)
=
a
r
g
m
a
x
Y
P
(
Y
)
P
(
X
∣
Y
)
を求める
ベイズの定理による式変形
P
(
Y
)
P(Y)
P
(
Y
)
は学習データ中の比率で計算できる
P
(
X
∣
Y
)
P(X|Y)
P
(
X
∣
Y
)
は
P
(
X
∣
Y
)
=
∏
i
N
P
(
f
i
∣
Y
)
P(X|Y)=\prod_i^N P(f_i | Y )
P
(
X
∣
Y
)
=
∏
i
N
P
(
f
i
∣
Y
)
と仮定する
X
=
f
1
,
f
2
,
⋯
,
x
N
X={f_1, f_2, \cdots, x_N}
X
=
f
1
,
f
2
,
⋯
,
x
N
となる多次元変数と仮定
素性
f
i
f_i
f
i
間の依存関係は無く,独立と仮定(=ナイーブ)
ゼロ頻度問題の解決法
スムージングして最尤推定
事前分布にディリクレ分布を用いてMAP推定
モデル
多変数ベルヌーイモデル
多項モデル
Links
イーブベイズ分類器を頑張って丁寧に解説してみる
数式ベースの説明