Yuta Hayashibe
プロフィール
研究発表
データ
ソフトウェア
技術情報
MeCab
CaboCha
JUMAN
コーパス
文字コード
その他ツール
研究ノート
述語項構造解析
機械学習
音声言語処理
技術情報
コーパス
日本語話し言葉コーパス(CSJ)
日本語話し言葉コーパス(CSJ)
学会講演と模擬講演が発話時間で約90%を占める
全体752万語
「コア」: 50万語.分節音ラベルとイントネーションラベルが付与されている
形態論情報
コアを含む100万語は人手付与
自動解析と人手付与では,用言の活用型と活用形の分類が
違う
Index
仕様
Links
公式ページ
データの概要
データの仕様
音声認識のための音響モデルと言語モデルの仕様