名詞句「N1のN2」の翻訳正解率とシャノンの情報量
スポンサーリンク
概要
- 論文の詳細を見る
用例主導型機械翻訳(EBMT)では、入力文と類似な用例(原言語表現と目的言語表現の対)を検索し、それを利用して翻訳を行う.例えば、「N1のN2」(N1,N2は名詞句)の場合、品詞・類語など7種類の属性から入力と用例との類似度を計算するのだが、この時、最良の類似度を持つ用例が多く出現することがある。そのため、これらの用例からどの用例を選択するかが、翻訳結果に影響を与える。今回、この複数の最良類似度の用例から最適な選択する基準を求めるために、シャノンの情報量を取り上げた。本稿では、まず、最良類似度を持つ複数の用例の翻訳正解率に対するシャノンの情報量の特徴を明らかにした。そして、それに基づいて最良の類似度を持つ複数の用例から最適な用例を選択するための尺度を実験により求めた。最後に、これを実際にEBMTシステムの類似用例検索処理に組み込み、翻訳正解率の向上効果を調べた。
- 一般社団法人情報処理学会の論文
- 1993-03-01
著者
関連論文
- 文法主導型OOI「意味モデルと属性文法との間での自然言語インタフェース」の考察
- 「時点」と「期間」で時制を制御する離散事象システムへの時相ペトリネットの変換方法
- 文法主導型OOI意味モデル上でのクラス内の時制表現とその処理
- オブジェクト指向インタプリタ設計「構文木に基づくクラス生成ルール」
- 構文文法における構文木手続きのオブジェクト指向アプローチ
- 拡張AELL(2)型構文解析手法を用いたインタプリタのインプリメントについて
- 「ロータス123」文書ファイル・「一太郎」文書ファイルの集計用4GLツール(第1版)
- 名詞句「N1のN2」の翻訳正解率とシャノンの情報量
- 用例主導型機械翻訳における並列検索手法