技術情報 コーパス 京都大学ウェブ文書リードコーパス 京都大学ウェブ文書リードコーパス さまざまなウェブ文書の冒頭3文に各種言語情報を人手で付与したテキストコーパス ニュース記事、百科事典記事、ブログ、商用ページなど多様なジャンル、文体の文書を含む 形態素・固有表現・構文・格関係,照応・省略関係,共参照,談話関係 約5,000文書(=約1.5万文) Version 1.0が2016年6月にリリースされた Links 配布元 萩行正嗣, 河原大輔, 黒橋禎夫. 多様な文書の書き始めに対する意味関係タグ付きコーパスの構築とその分析, 自然言語処理, Vol.21, No.2, pp.213-248, 2014.