辞書の構成
ファイル
- 文法辞書
- JUMAN.grammar (品詞分類を定義)
- JUMAN.katuyou (個々の活用型の具体的な活用形の一覧を定義)
- JUMAN.kankei (活用する各品詞に対して活用型の一覧を定義)
- 形態素辞書
- Assert.dic
- 判定詞"だ"1語のみ
- AuxV.dic: 助動詞
- 「活用型」が「判定詞」のものもある
- ContentW.dic: 基本語彙
- 感動詞, 形容詞, 接続詞, 動詞, 副詞, 名詞, 連体詞
- Demonstrative.dic: 指示詞
- Emoticon.dic: 顔文字
- Noun.hukusi.dic: 副詞的名詞
- Noun.keishiki.dic: 形式名詞
- Noun.koyuu.dic: 固有名詞
- Noun.suusi.dic: 数詞
- Postp.dic: 助詞
- Prefix.dic: 接頭辞
- Rengo.dic: 連語.JUMAN++では廃止
- Special.dic: 特殊
- Suffix.dic: 接尾辞
- Lexicon_from_rengo.dic: 連語から取り出したもの
- Onomatopoeia.dic: オノマトペ辞書(副詞)
- 非反復形のオノマトペを自動生成
- Rendaku.dic:
- Townname.dic
- Assert.dic
形態素辞書の仕様
〈形態素定義〉 ::= (〈#形態品詞名〉〈形態素情報の並び〉) |
(〈#形態品詞名〉(〈#品詞細分類名〉〈形態素情報の並び〉))
〈形態素情報の並び〉 ::= 〈形態素情報〉 | 〈形態素情報〉〈形態素情報の並び〉
〈形態素情報〉 ::= (〈見出し語情報〉〈読み情報〉〈活用型情報〉〈意味情報〉)
〈見出し語情報〉 ::= (見出し語 〈見出し語内容の並び〉)
〈見出し語内容の並び〉::= 〈見出し語内容〉 | 〈見出し語内容の並び〉
〈見出し語内容〉 ::= 〈#見出し語表記〉 | (〈#見出し語表記〉) |
(〈#見出し語表記〉〈#数値〉)
〈読み情報〉 ::= (読み 〈#読み表記〉)
〈活用型情報〉 ::= (活用型 〈#活用型名〉) | NIL
〈意味情報〉 ::= (意味情報 〈#意味記述〉) | NIL
形態素構造
形態素mの「形態素構造」を,「形態品詞・品詞細分類・活用型・活用形・表層形」の5項組で表わす