各フィールドの説明

  • 短単位・長単位混合形式: 拡張子はsdb
  • 長単位形式: 拡張子はldb.18〜25行目は含まれない.
フィールド番号 フィールド名 内容
1 ID 当該長単位の通し番号(8桁)
2 後続ID 後続する長単位のID(後続する長単位が存在しない場合は,00000000)
3 講演ID 当該長単位が収録されている転記テキストの講演ID
4 転記情報 当該長単位を含む転記単位のタイムスタンプなど
5 前文脈 当該単位に先行する文脈(最大15短単位)
6 出現形 当該長単位の転記テキスト(基本形)における出現語形
7 後文脈 当該単位に後続する文脈(最大15短単位)
8 タグなし出現形 出現形から転記テキストのタグを取り除いたもの
9 代表形 出現形の標準的な語形(国語辞典の見出しに相当)
10 代表表記 代表形を漢字,仮名などで表記したもの
11 発音形 当該長単位の発音形(転記テキストの発音形に相当)
12 品詞 当該長単位の品詞
13 活用の種類 当該長単位の活用の種類(「カ行五段」等)
14 活用形 当該長単位の活用形(「連用形」等)
15 その他の情報1 品詞の下位分類(「助詞」の下位分類として「格助詞」等)
16 その他の情報2 語形の情報(「促音便」等)
17 その他の情報3 「言いよどみ」「メタ」等の補足情報(複数情報がある場合は,全角スペースで区切る)
18 品詞[長] 長単位の品詞
19 活用の種類[長] 長単位の活用の種類
20 活用形[長] 長単位の活用形
21 その他の情報1[長] 長単位のその他の情報1
22 その他の情報2[長] 長単位のその他の情報2
23 その他の情報3[長] 長単位のその他の情報3
24 代表形[長] 長単位の代表形
25 代表表記[長] 長単位の代表表記

| 参考文献