表層的な文脈情報を用いた自然な文生成の試み

概要

論文の詳細を見る
英日機械翻訳において、代名詞の翻訳は解決が非常に困難なものの一つである。ゼロ代名詞の補完や代名詞の照応、あるいは特定分野における代名詞の訳語選択などは言及されることが多いが、自然な日本語を生成するために、英語で代名詞になっているものをそのまま代名詞で翻訳するか、あるいは照応先の名詞で置き換えるかなどの翻訳方法の差異の要因は、まだ明らかでない。代名詞処理は補完あるいは照応解析に主眼が置かれており、特に生成の際の省略に関しては、「日本語は省略が可能な言語だから重複する情報はどんどん省略すればよい」などと言われることがある割には、その妥当性についてはあまり触れられることがない。また、一般の機械翻訳システムでは、省略による誤解や誤った情報欠落を防ぐために、重複する情報であっても重複したまま出力することが多い。人間の翻訳者による翻訳はある程度自然な文生成の一例と言える。本稿では、自然な日本語文を生成するための一つの試みとして、代名詞の翻訳方法に着目し、英文と人間の翻訳者によるその日本語への翻訳文を対象に代名詞翻訳方法を分類して、自然な日本語を生成する際の代名詞の生成処理方法について考察する。また、その生成処理の中で、表層の文脈情報をどれだけ適用することができるかを調査し、代名詞訳出における表層的な文脈情報の有効性を検証する。
一般社団法人情報処理学会の論文
1996-03-06

表層的な文脈情報を用いた自然な文生成の試み

スポンサーリンク

概要

著者

関連論文

スポンサーリンク