EMアルゴリズム
概要
-
不完全データ(一部欠損)に対する,尤度最大化の枠組み
-
尤度関数L(θ;x,z)
- θ: パラメータ
- x: 観測データ
- z: 潜在データあるいは欠損値
-
パラメータの最尤推定値は,観測データに対する周辺尤度最大化
-
この最適化問題は解析的に解けない
-
繰り返しにより解を求める
繰り返し
- Eステップ
- 現在推定されているパラメータの分布θ(t)の下で,尤度関数の条件付き確率P(z∣x)に関する期待値を計算
- Q関数とよび単調増加する
- Q(θ∣θ(t))=EZ∣x,θ(t)[logL(θ;x,z)]
- Mステップ
- θを更新する
- θ(t+1)=argmaxθQ(θ∣θ(t))
例
K個のガウス分布の重ね合わせからなる混合ガウス分布
p(x)=∑k=1KπkN(x∣μ,σk)
- パラメータは平均μk,分散σk,混合係数πk
- 混合係数から潜在変数zが導入できるp(z)=Πk=1Kπkzk
EMアルゴリズムは次のようになる
- パラメータを初期化し,対数尤度の初期値を計算
- Eステップ: zの条件付き確率を求める
- Mステップ: パラメータを更新する
参考文献