Yuta Hayashibe

CW

  • CWはこれまでの重みを考慮して更新する
  • 具体的には,重みベクトルw\bold{w}を生成する正規分布wN(boldsymbolμ,Σ)\bold{w} \sim N (boldsymbol{\mu}, \bold{\Sigma})を考える
    • 重み平均値ベクトルμRm\bold{\mu} \in R^m
    • 共分散行列: ΣRm×m\bold{\Sigma} \in R^{m \times m}
  • アイデア
    • PAと同様に,更新時に現在の重みの分布と(KLダイバージェンスが)近い重みの分布を探す
    • 学習データを確率η\eta未満でしか間違えないように更新する (0.5<η10.5<\eta\leq 1)

更新式

  • 以下の更新則
    • (μ(t+1,Σ(t+1))=argmaxμ,ΣDKL(N(μ,Σ)N(μ(t),Σ(t)))(\mu^{(t+1}, \Sigma^{(t+1)}) = \arg \max_{\mu, \Sigma} D_{KL} \left( N(\mu,\Sigma) || N(\mu^{(t)}, \Sigma^{(t)}) \right)
    • subject to PwN(μ,Σ)(y(t),wx(t)0)ηP_{\bold{w} \sim N(\mu, \Sigma)} (y^{(t)}, \bold{w} \cdot \bold{x}^{(t)} \leq 0) \leq \eta
  • 詳細はオンライン機械学習本の4.1.4(p.72)を参照

問題点

  • ノイズに弱い
    • 更新時に,現在のデータを必ず正しく分類できるようにするため