訳文理解のための概念辞書の利用について
スポンサーリンク
概要
- 論文の詳細を見る
自然言語処理の一つである機械翻訳システムは、まだ不完全なものであるが、技術文献やマニュアルなどの資料の翻訳においては実用化の段階にきている[l]。現在の機械翻訳システムが不完全である理由の一つに、翻訳処理の単位が一文単位で行なわれているということが挙げられる。一文を解析する際に例えば単語の品詞に曖昧性があった場合、その単語に隣接する単語の情報から暖昧性を解消することができるように、ある文に暖昧性があった場合、その文の前に現われる文の情報を利用してその暖昧性を解消することも十分可能なはずである[2]。当研究室では、現在、文脈に依存した暖昧性を計算機に解消させる方式について研究を進めており、その一つとして概念辞書の利用を検討している。特に問題となるのは、実際の文章の暖昧さを解消して人間にとって理解容易な訳文を生成するためには、概念辞書にどのような情報を持たせることが効果的であるのかを検証することである。そこで、今回は日英翻訳を行なって得られた複数の英文中の単語間の関係を認識し、それらを表示させた場合、人間がその英訳文を理解するのに役立つかどうかを検討したので報告する。この方法は、翻訳処理で用いている辞書をもとに概念辞書データの一部を作成し、この概念辞書と、既存の翻訳シテムから出力される訳文とを使用する。なお、ここでいう概念辞書とは、単語の表層表現や文法属性、訳語などを記述した通常の辞書とは異なり、ある概念と他の概念との関係を記述したものである。概念辞書の一例としてEDR(日本電子化辞書研究所)で開発しているもの[3]がある。
- 一般社団法人情報処理学会の論文
- 1991-02-25