辞書のフィールド

  • 階層
    • 1.語彙素: 辞書の見出し相当 (eg: 矢張り (やはり))
    • 2.語形: 同じ語彙素に所属するものに対して語形ゆれを区別 (eg: 矢張り->{ヤハリ,ヤッパリ,ヤッパ})
    • 3a.書字形: 同じ語形に所属するものに対して表記ゆれを区別 (eg: ヤハリ->{やはり,ヤハリ,矢張り}, ヤッパリ->{やっぱり,ヤッパリ})
    • 3b.発音形: 同じ語形に所属するものに対して発音ゆれを区別 (eg: データ->{データ,データー})

UniDic 3.1.0のフィールド

番号 属性名 属性ラベル 階層 説明
1 品詞大分類 pos1 語形
2 品詞中分類 pos2 語形
3 品詞小分類 pos3 語形
4 品詞細分類 pos4 語形
5 活用型 cType 語形
6 活用形 cForm 語形
7 語彙素読み lForm 語彙素 lemmaのカタカナ表記
8 語彙素表記 lemma 語彙素 語彙素見出し
9 書字形出現形 orth 書字形 orthBaseが活用変化を受けたもの
10 発音形出現形 pron 発音形 pronBaseが活用変化を受けたもの
11 書字形基本形 orthBase 書字形 書字形見出し
12 発音形基本形 pronBase 発音形 発音形見出し(カタカナ表記)
13 語種 goshu 語彙素
14 語頭変化型 iType 語形
15 語頭変化形 iForm 語形
16 語末変化型 fType 語形
17 語末変化形 fForm 語形
18 語頭変化結合形 iConType 語形
19 語末変化結合形 fConType 語形
20 語彙素類 lType 語彙素
21 仮名形出現形 kana 書字形 orthのカタカナ表記
22 仮名形基本形 kanaBase 書字形 orthBaseのカタカナ表記
23 語形 form 語形 formBaseが活用変化を受けたもの
24 語形基本形 formBase 語形 語形見出し(カタカナ表記)
25 アクセント型 aType 発音形 アクセント核の位置
26 アクセント結合型 aConType 発音形
27 アクセント修飾型 aModType 発音形
28 語彙表ID lid
29 語彙素ID lemma_id 語彙素
(表層例) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
こおりつけ 動詞 一般 五段-カ行 命令形 コオリツク 凍り付く こおりつけ コーリツケ こおりつく コーリツク コオリツケ コオリツク コオリツケ コオリツク 4 C1 14751881322701601 53667
補助記号 句点 記号 補助 12378129441280 45
もく 名詞 普通名詞 助数詞可能 モク もく モク もく モク モク モク モク モク 1 C3 10349711609438720 37652
ようび 名詞 普通名詞 一般 ヨウビ 曜日 ようび ヨービ ようび ヨービ ヨウビ ヨウビ ヨウビ ヨウビ 0 C2 10758455090618880 39139
木曜 名詞 普通名詞 副詞可能 モクヨウ 木曜 木曜 モクヨー 木曜 モクヨー モクヨウ モクヨウ モクヨウ モクヨウ 3,0 C2 10359882058441216 37689
名詞 普通名詞 副詞可能 ヒ混合 基本形 0,1 C3 8548161773773312 31098

注意