学習

変換ツール

  • tools/kc2juman.pl
    • 京都大学テキストコーパスをCaboCha形式(JUMAN品詞体系)の学習データに変換
  • tools/kcs2cabocha.pl
    • 京都大学テキストコーパスをCaboCha形式(IPA品詞体系, もしくは Unidic品詞体系)の学習データに変換
    • 実行にはMeCabのperlモジュールが必要

モデル

  • JUMANモデル
    • 京都大学テキストコーパス 4.0 から直接学習できる
  • IPA・Unidicモデル
    • 京都大学テキストコーパス4.0をMeCabを使い形態素解析部分だけ自動解析した結果から学習
    • そのため,IPA・Unidicは解析精度がJUMANのものと比べると落ちる
  • Unidic品詞体系は,短単位であり係り受け解析に必ずしも有効な単位・品詞情報が付与されていない
    • JUMANモデルに比べ,1%程度解析精度が落ちる

Links