JUMANの更新履歴
- JUMAN++ 1.00 (2016-09-23)
- コストを機械学習
- Recurrent Neural Network Language Model(RNNLM) も使用
- 辞書の語彙も更新
- ver 7.0 (2012-01-12)
- 非反復形オノマトペ,長音記号による非標準表記,長音記号・小書き文字を用いた長音化の自動認識
- Wikipediaから抽出した辞書の追加
- 自動辞書(Webテキストから自動獲得した辞書)の改良
- UTF-8化
- ver 6.0 (2009-09-26)
- 意味カテゴリの付与
- ドメインの付与
- 固有名詞辞書の語彙と意味情報の整理・付与
- 語の意味関係の整理と意味情報の付与
- 連濁,反復形オノマトペ,小書き文字による非標準表記の自動認識
- 未知語の自動獲得
- 意味情報の表記法の整理
- ver 5.1 (2005-09-07)
- 従来KNPで付与していた語の意味情報をJUMANで付与することに変更.
- (付属動詞候補,補文ト,〜を〜に構成語 など)
- ver 5.0 (2005-03-23)
- 日本語の基本的語彙,約3万語(固有名詞を除く)を選定した.
- 表記バリエーションの整備を行い,代用表記を出力することとした.
- その他の整備(読みの音訓情報の付与,「読ます」「読まされる」などの使役形への対応)
- ver 4.0 (2003-07-19)
- EDR日本語単語辞書の利用をやめ,大規模テキスト中の統計量をもとに,約6万8千語の独自の辞書を構築
- ver 3.1 (1996-11)
- ver 3.0 (1996-10)
- ver 3.0beta (1996-06)
- 連語処理機能の追加
- 標準形態素辞書の整備
- 標準文法辞書の整備
- 1992
参考文献
コメント
- 昔はEDRを使っていたようだ
- 辞書情報を地道にリッチにしていったのですね