Yuta Hayashibe
プロフィール
研究発表
データ
ソフトウェア
技術情報
MeCab
CaboCha
JUMAN
コーパス
文字コード
その他ツール
研究ノート
述語項構造解析
機械学習
音声言語処理
技術情報
詳解 JUMAN / JUMAN++
詳解 JUMAN / JUMAN++
資料
JUMANの更新履歴
辞書
辞書の構成
辞書の中身
品詞体系
活用型
活用形
活用についてのメモ
概要
規則による形態素解析器
コスト最小法
益岡・田窪文法ベース
品詞体系
「特殊」(句読点・記号・括弧など) を加えた
接辞を「接頭辞」「接尾辞」に分けた
計14種類の形態品詞を定義
文法
文語的表現・口語的表現・敬語表現に対応するために拡張
21個の一般的な活用型
7個の特殊な活用型
辞書は表記ゆれ情報/意味情報を保持
KNPで語義曖昧性解消する
参考文献
JUMAN公式サイト
JUMAN++公式サイト
日本語形態素解析器に関するメモ
JUMAN/KNPのチュートリアルのスライド@(京都大学学術情報メディアセンター, メディア情報処理専修コース「自然言語処理技術」, 2009/09/30
JUMAN付属の
manual.pdf
松本裕治, 黒橋禎夫, 宇津呂武仁, 妙木裕, 長尾真. (1994). 日本語形態素解析システムJUMAN 使用説明書 version 2.0. NAIST Technical Report, NAIST-IS-TR94025.
JUMANメモ