基礎
- P(X=x,Y=y): 結合確率=同時確率
- P(X=x∣Y=y): 条件付き確率
- P(x)=∑yP(x,y): xの周辺確率
- ベイズの定理
- P(y∣x)=P(x)P(y)p(x∣y)
- 恒等式
- P(y∣x)の計算は難しいがp(x∣y)の計算が簡単なときに使う
- 尤度: データの生成確率
- 確率変数XのサンプルデータD=x1,x2,⋯,xNの生成確率(尤度): P(D)=∏xi∈Dp(xi)
- 対数をとった対数尤度をよく使う: logP(D)=∑xi∈Dlogp(xi)
- logP(D)=∑x(freq(x,D)logp(x))
離散確率分布
連続確率分布
- 正規分布(ガウス分布)
- ディリクレ分布
- 多項分布のパラメータの確率分布として使うことが多い(極端なパラメータ値になりぬくいことを仮定している)
パラメータ推定
最尤推定 (maximum likelihood estimation)
- 対数尤度が最も高くなるようにパラメータを決定する方法
- できる限りデータにフィットさせる
MAP推定 (maximum a posteriori estimation)
- 事後確率p(θ∣D)が最大になるようにパラメータを決定する方法
- 事前分布にある種の仮定をおき,観測データにひきずられすぎないようにする
- パラメータθの確率分布P(θ)(事前確率分布)がわかっているとき,p(θ∣D)を事後確率という