技術情報 コーパス 日本語話し言葉コーパス(CSJ) 日本語話し言葉コーパス(CSJ) 学会講演と模擬講演が発話時間で約90%を占める 全体752万語 「コア」: 50万語.分節音ラベルとイントネーションラベルが付与されている 形態論情報 コアを含む100万語は人手付与 自動解析と人手付与では,用言の活用型と活用形の分類が違う Index 仕様 Links 公式ページ データの概要 データの仕様 音声認識のための音響モデルと言語モデルの仕様