京都大学ウェブ文書リードコーパス

  • さまざまなウェブ文書の冒頭3文に各種言語情報を人手で付与したテキストコーパス
    • ニュース記事、百科事典記事、ブログ、商用ページなど多様なジャンル、文体の文書を含む
    • 形態素・固有表現・構文・格関係,照応・省略関係,共参照,談話関係
  • 約5,000文書(=約1.5万文)
  • Version 1.0が2016年6月にリリースされた

Links