Yuta Hayashibe

EMアルゴリズム

概要

  • 不完全データ(一部欠損)に対する,尤度最大化の枠組み

  • 尤度関数L(θ;x,z)L(\theta ;x,z)

    • θ\theta: パラメータ
    • xx: 観測データ
    • zz: 潜在データあるいは欠損値
  • パラメータの最尤推定値は,観測データに対する周辺尤度最大化

  • この最適化問題は解析的に解けない

  • 繰り返しにより解を求める

繰り返し

  • Eステップ
    • 現在推定されているパラメータの分布θ(t)\theta^{(t)}の下で,尤度関数の条件付き確率P(zx)P(z|x)に関する期待値を計算
    • Q関数とよび単調増加する
    • Q(θθ(t))=EZx,θ(t)[logL(θ;x,z)]Q (\theta | \theta^{(t)} ) = E_{Z|x,\theta^{(t)}} [ \log L(\theta ;x,z) ]
  • Mステップ
    • θ\thetaを更新する
    • θ(t+1)=argmaxθQ(θθ(t))\theta^{(t+1)} = argmax_\theta Q (\theta | \theta^{(t)} )

K個のガウス分布の重ね合わせからなる混合ガウス分布 p(x)=k=1KπkN(xμ,σk)p(\bold{x}) = \sum_{k=1}^{K} \pi_k N(\bold{x}| \mu, \sigma_k)

  • パラメータは平均μk\mu_k,分散σk\sigma_k,混合係数πk\pi_k
  • 混合係数から潜在変数z\bold{z}が導入できるp(z)=Πk=1Kπkzkp(\bold{z}) = \Pi_{k=1}^{K} \pi_k^{z_k}

EMアルゴリズムは次のようになる

  1. パラメータを初期化し,対数尤度の初期値を計算
  2. Eステップ: z\bold{z}の条件付き確率を求める
  3. Mステップ: パラメータを更新する

参考文献