SVM

ハードマージンSVM

線形分離可能: 分離超平面を引いてすべてのデータが分類できる
方針: 分離超平面を2クラスの事例の出来る限り"真ん中"に引く
- サポートベクトル(SV) ${{\bold x}}^*$: 平面から一番近い各クラスのデータ点
- マージン: SVから分離超平面までの距離
導出
- 分離超平面を表す式: $f({{\bold x}}) = y ( {{\bold w}}^T {{\bold x}} + b) = 0$
  - 分離超平面上の全ての点${{\bold x}}$がこの式を満たす
- マージン: $\frac{ | {{\bold w}}^T {{\bold x}}^* +b | }{ | {{\bold w }} | }$
  - ${{\bold w}}, b$の全要素を定数倍するといくらでもマージンを大きくできる
  - $ | {{\bold w}}^T {{\bold x}}^* +b | = 1 $としても一般性は失われない
- マージンは (ア) $\frac{1}{|{{\bold w}}|}$と書き直せる
- また，どのデータサンプルも分離超平面との距離はマージン以上なので，全てのデータサンプル${{\bold d}}$について以下の式が成り立つ
  - (イ) $\frac{ | {{\bold w}}^T {{\bold d}} +b | }{ | {{\bold w }} | } \geq \frac{1}{|{{\bold w}}|} \Leftrightarrow | {{\bold w}}^T {{\bold d}} +b | \geq 1$
- したがって，(イ)の制約下で「(ア)を最大化」(目的関数)するのがハードマージンSVM
  - 目的関数の最大化問題は，目的関数を置き換えることで最小化問題ともみなせる
  - $ \max \frac{1}{|{{\bold w}}|} \Leftrightarrow \min | {{\bold w}} |^2 $