同義語情報を用いた確率的単語アライメントモデル

スポンサーリンク

概要

論文の詳細を見る
二言語間の教師なし単語アライメント問題に対して,単言語リソースである同義語辞書情報を利用して単語対応付けの精度を向上させる手法を提案する.対訳文には同じ意味を表す様々な表現が用いられるため,同義語情報を利用することでデータスパースネスの問題を解消し単語アライメントの精度向上が期待できる.しかし,単語には多義性があり,ある単語ペアが同義語であるかどうかは文脈に大きく依存する.そこで,我々はトピックモデルを利用して,同義語情報を文脈に応じて学習させる同義語の確率モデルを考案する.さらに,同義語モデルを既存の単語アライメントモデルと同時に学習させる枠組みを提案する.対訳コーパスを用いたアライメント実験の結果,同義語情報を用いない場合や,同義語情報を文脈を考慮せずに同義語情報を利用した場合に比べて,提案手法では高い精度が得られることを確認した.
2010-09-21

著者

関連論文

もっと見る

スポンサーリンク