JUMANの更新履歴

  • JUMAN++ 1.00 (2016-09-23)
    • コストを機械学習
    • Recurrent Neural Network Language Model(RNNLM) も使用
    • 辞書の語彙も更新
  • ver 7.0 (2012-01-12)
    • 非反復形オノマトペ,長音記号による非標準表記,長音記号・小書き文字を用いた長音化の自動認識
    • Wikipediaから抽出した辞書の追加
    • 自動辞書(Webテキストから自動獲得した辞書)の改良
    • UTF-8化
  • ver 6.0 (2009-09-26)
    • 意味カテゴリの付与
    • ドメインの付与
    • 固有名詞辞書の語彙と意味情報の整理・付与
    • 語の意味関係の整理と意味情報の付与
    • 連濁,反復形オノマトペ,小書き文字による非標準表記の自動認識
    • 未知語の自動獲得
    • 意味情報の表記法の整理
  • ver 5.1 (2005-09-07)
    • 従来KNPで付与していた語の意味情報をJUMANで付与することに変更.
    • (付属動詞候補,補文ト,〜を〜に構成語 など)
  • ver 5.0 (2005-03-23)
    • 日本語の基本的語彙,約3万語(固有名詞を除く)を選定した.
    • 表記バリエーションの整備を行い,代用表記を出力することとした.
    • その他の整備(読みの音訓情報の付与,「読ます」「読まされる」などの使役形への対応)
  • ver 4.0 (2003-07-19)
    • EDR日本語単語辞書の利用をやめ,大規模テキスト中の統計量をもとに,約6万8千語の独自の辞書を構築
  • ver 3.1 (1996-11)
  • ver 3.0 (1996-10)
  • ver 3.0beta (1996-06)
    • 連語処理機能の追加
    • 標準形態素辞書の整備
    • 標準文法辞書の整備
  • 1992
    • 開発開始

参考文献

  • JUMAN付属のmanual.pdf

コメント

  • 昔はEDRを使っていたようだ
  • 辞書情報を地道にリッチにしていったのですね