学習
変換ツール
tools/kc2juman.pl
- 京都大学テキストコーパスをCaboCha形式(JUMAN品詞体系)の学習データに変換
tools/kcs2cabocha.pl
- 京都大学テキストコーパスをCaboCha形式(IPA品詞体系, もしくは Unidic品詞体系)の学習データに変換
- 実行にはMeCabのperlモジュールが必要
モデル
- JUMANモデル
- 京都大学テキストコーパス 4.0 から直接学習できる
- IPA・Unidicモデル
- 京都大学テキストコーパス4.0をMeCabを使い形態素解析部分だけ自動解析した結果から学習
- そのため,IPA・Unidicは解析精度がJUMANのものと比べると落ちる
- Unidic品詞体系は,短単位であり係り受け解析に必ずしも有効な単位・品詞情報が付与されていない
- JUMANモデルに比べ,1%程度解析精度が落ちる