第3言語を介した対訳辞書の自動生成(多言語処理・質問応答)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、一方の言語が同一である2つの対訳辞書から新しい言語対の対訳辞書を生成する新しい方法を提案する。提案方法の特徴は、第1言語と第2言語それぞれの単一言語コーパスを用いることにより、媒介となる第3言語の語の多義性によって生み出される誤った訳語を除去することである。提案方法は、それぞれの言語のコーパスから関連の強い語のペアを抽出し、第1言語の関連語ペアと第2言語の関連語ペアのアラインメントをとることにより、第1言語の1つの語の各関連語がそれぞれ第2言語のどの訳語を支持するかを決定する。そして、一定の比率以上の関連語に支持される訳語を選定する。誤った訳語を支持する関連語は非常に少ないので、誤った訳語は除去されることになる。日英と中英の対訳辞書から日中対訳辞書を生成する予備実験を行い、提案方法のフィージビリティを確認した。
- 一般社団法人情報処理学会の論文
- 2007-11-19
著者
-
梶 博行
静岡大学情報学部情報科学科
-
Erdenebat Dashtseren
Department Of Computer Science Shizuoka University
-
玉村 真一
静岡大学大学院情報学研究科