MeCab辞書について

MeCabの辞書についての情報をまとめました.

素性フィールドの形式

素性フィールドは,カンマ区切りではなく,CSV形式. 単純に,でsplitしてはいけない.

例えば,

た      助動詞,*,*,*,助動詞-タ,終止形-一般,タ,た,た,タ,タ,和,た,タ,タ,タ,*,*,*,*,*,*,*,"動詞%F2@1,形容詞%F4@-2",*

,をフィールドに含む.

素性フィールドの比較

(表層例) | 0 | 1| 2| 3| 4| 5| 6| 7| 8| 9| 10| 11| 12| 13| 14| 15| 16| 17| 18| 19| 20| 21| 22| 23| 24 ---- | ---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- |---- | NAIST-jdic/IPADIC | 品詞 | 品詞細分類1 | 品詞細分類2 | 品詞細分類3 | 活用型(ctype) | 活用形(cform) | 原形 | 読み | 発音 JUMAN | 品詞 | 品詞細分類 | 活用型(ctype) | 活用形(cform) | 見出し語 | 読み | 意味情報・代表表記 Unidic | 品詞大分類 | 品詞中分類 | 品詞小分類 | 品詞細分類 | 活用型 | 活用形 | 語彙素読み | 語彙素表記 | 書字形出現形 | 発音形出現形 | 仮名形出現形 | 語種 | 書字形基本形 | 発音形基本形 | 仮名形基本形 | 語形基本形 | 語頭変化型 | 語頭変化形 | 語頭変化結合形 | 語末変化型 | 語末変化形 | 語末変化結合形 | アクセント型 | アクセント結合型 | アクセント修飾型

参考文献