Yuta Hayashibe
プロフィール
研究発表
データ
ソフトウェア
技術情報
MeCab
CaboCha
JUMAN
コーパス
文字コード
その他ツール
研究ノート
述語項構造解析
機械学習
音声言語処理
技術情報
詳解 JUMAN / JUMAN++
JUMAN辞書
JUMAN辞書
"jumanの辞書は素晴らしい"という声を,何度か耳にした. そこで,どのような辞書を含んでいるのかを調べてみた.
益岡・田窪文法に基づく品詞体系
表記ゆれ情報/意味情報を保持
後続のKNPを使って語義曖昧性解消する
コストは人手で設定
そのため精度はMeCabに負ける
統語的な情報が豊富
辞書の方針
基本語彙(約3万語)のみを人手で整備し、残りは自動獲得
基本語彙には人手で様々な意味情報を付与
意味情報
代表表記
カテゴリ
ドメイン
可能動詞
付属動詞候補
...
資料
辞書の構成
辞書の中身
品詞体系
活用型
活用形
活用についてのメモ