CW

CWはこれまでの重みを考慮して更新する
具体的には，重みベクトル$\bold{w}$を生成する正規分布$\bold{w} \sim N (boldsymbol{\mu}, \bold{\Sigma})$を考える
- 重み平均値ベクトル$\bold{\mu} \in R^m$
- 共分散行列: $\bold{\Sigma} \in R^{m \times m}$
アイデア
- PAと同様に，更新時に現在の重みの分布と（KLダイバージェンスが）近い重みの分布を探す
- 学習データを確率$\eta$未満でしか間違えないように更新する ($0.5<\eta\leq 1$)

更新式

以下の更新則
- $(\mu^{(t+1}, \Sigma^{(t+1)}) = \arg \max_{\mu, \Sigma} D_{KL} \left( N(\mu,\Sigma) || N(\mu^{(t)}, \Sigma^{(t)}) \right)$
- subject to $P_{\bold{w} \sim N(\mu, \Sigma)} (y^{(t)}, \bold{w} \cdot \bold{x}^{(t)} \leq 0) \leq \eta$
詳細はオンライン機械学習本の4.1.4(p.72)を参照

問題点

ノイズに弱い
- 更新時に，現在のデータを必ず正しく分類できるようにするため