Yuta Hayashibe
プロフィール
研究発表
データ
ソフトウェア
技術情報
MeCab
CaboCha
JUMAN
コーパス
文字コード
その他ツール
研究ノート
述語項構造解析
機械学習
音声言語処理
技術情報
コーパス
京都大学ウェブ文書リードコーパス
京都大学ウェブ文書リードコーパス
さまざまなウェブ文書の冒頭3文に各種言語情報を人手で付与したテキストコーパス
ニュース記事、百科事典記事、ブログ、商用ページなど多様なジャンル、文体の文書を含む
形態素・固有表現・構文・格関係,照応・省略関係,共参照,談話関係
約5,000文書(=約1.5万文)
Version 1.0が2016年6月にリリースされた
Links
配布元
萩行正嗣, 河原大輔, 黒橋禎夫. 多様な文書の書き始めに対する意味関係タグ付きコーパスの構築とその分析, 自然言語処理, Vol.21, No.2, pp.213-248, 2014.