深層格とゼロ代名詞の同時解析 [@Kudo:2014:ACL]

目的

日英機械翻訳のために，深層格とゼロ代名詞の同時解析を行う
主な困難な点
- ヴォイスの推定: れる/られるは受動態でも可能態(potential)でも使われる
- 表層ガ格: 可能態では主格から目的格に解釈が変わる
- topic case marker「は」: 英語に存在せず，文脈に応じて文法役割が変わる
- 主格はよく省略される

項と述語の同時確率を $ P(p, z, v, A, S, D)$ と定義する．

$p$: 述語
- 同一文の他の述語とは独立と仮定
$z$: $p$のゼロ主格($\neq$主格)の候補
- $z \in Z = $ {I, you, we, it, he/she, imperative, already_exists}
- imperativeはinvisible subjectを示す
- already_existsは文中に存在することを示す
$v$: $p$のヴォイスの種類
- $v \in V = $ {能動，受動，可能}
$a_k \in A$: $k$番目の項
- 項: 述語を修飾するor修飾される
- 関係節では述語が項を修飾する
$s_k$: $a_k$と$p$間の表層格ラベル
- $s \in S$
$d_k$: $a_k$と$p$間の深層格ラベル
- $d \in D$ = {subject, object, other}

$p$を与えられた上で解くべき問題は，以下の最適化問題．

$ \langle \hat{z}, \hat{v}, \hat{D} \rangle= argmax_{z, v, D} P(p, z, v, A, S, D)$

これを解くのは難しいので近似する． $ P(p, z, v, A, S, D) \approx P_z(z\mid p, A, S) P_v(v\mid p, A, S) P_d(D\mid p, v, A, S) P(p, A, S)$

$P(p, A, S)$は定数項なので，以下は$P_z, P_d, P_v$にいて考える．

最適化問題の近似で，ゼロ主格と深層格は独立だと仮定した
しかし現実的ではないので，以下の制約を導入
- 主格は必須
- 1つの述語が複数の主格や目的格は取らない
整数線形計画(ILP)で解く
- $x_i$: ある1つのbinary decisionを表すバイナリラベル (eg: $x_k=1$ if $d_i=subj$ and $v=$ active)
- $p_i$: $x_i$の確率
- $\{ \hat{x}, \ldots, \hat{x_n} \} = argmax \sum_i \log(p_i)x_i $
  - s.t. linear constrains over $\{ x_1, \ldots, x_n \}$

$ P(p, z, v, A, S, D)$のlogを取ることで，最適化問題がILPに変換された

ルールで変換する．例えば，「今日は酒が飲める」を「zero_subject 飲めるが酒は今日」

ここでは，詳細は割愛する．

日英翻訳システム(Och2003)を使用
- destortion limit は4単語
- webから収集した300M単語データ
- ランダム抽出した1万文で評価
shift-reduce parserで係り受け解析
ゼロ主格モデル$P_z$
- 人手でアノテーションしたweb2万文
ヴォイス種類モデル$P_v$
- 人手でアノテーションしたweb5000文