日英対訳コーパスを用いた文章外照応ゼロ代名詞解析規則の自動獲得
スポンサーリンク
概要
- 論文の詳細を見る
自然言語では通常, 相手(読み手もしくは聞き手)に容易に判断できる要素は, 文章上表現しない場合が多い。特に, 日本語では格要素が省略される傾向が強いのに対し, 英語では訳出上必須要素となるため, 日英機械翻訳システムにおいては, この省略格要素(ゼロ代名詞)の照応解析技術は重要となる。日本語ゼロ代名詞の照応解析に関しては, 従来から様々な手法が提案されているが, 翻訳対象分野を限定しない機械翻訳への応用を考えると, 解析精度, 対象とする言語現象, 必要となる知識量の面で問題があった。これに対しては, 分類した用言の意味属性, 様相表現, 接続表現を用いて指示対象を決定する機械翻訳に適した照応解析手法が提案されている。しかしこれら従来手法では, 基本的に人間が照応解析規則を作成する必要があるため, 網羅的な照応解析規則の作成には, かなりの専門知識と労力が必要となる。さらに, 解析対象分野に応じて, 指示対象の傾向の異なるゼロ代名詞が存在するので, 分野に依存した規則を作成する必要がでてくるが, 分野毎に規則を作成することはその労力を考えると不可能である。よって, このゼロ代名詞の照応解析ルールを効率的に獲得する手法の実現が望まれている。近年, 既存のコーパスを用いて, コーパス中の言語現象を分析し, その結果を基に照応解析規則を抽出する手法が提案されている。しかし, それらの手法は解析対象言語のコーパスのみを使用するため, その言語ではほぼ常にゼロ化される要素への規則を抽出することは困難である。よって, 利用するコーパスとしては, 解析対象の言語と他の言語の対訳コーパス利用することが有望である, 特に, 日本語と英語のように言語族が異なる場合には, 省略現象の傾向が異なるため, ある言語の文ではゼロ化されている要素が, その文の対訳文では明記される場合が多々有り, その利用が有望である。本稿では, このような目的を達成するための第1段として, 対訳関係にある日英の対訳文からなる日英対訳コーパスから, 文章外照応ゼロ代名詞の照応解析規則を抽出する手法を提案する。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
関連論文
- 複数の編集距離を用いた口語翻訳文の自動評価
- 電子化辞書:日本語語彙大系とその適用
- 3N-4 ナ型形容詞に対する日英対訳用例文の収集について
- 言語的類似性を最大利用した直接翻訳方式(言語理解とコミュニケーション一般)
- 日英機械翻訳における語用論的・意味論的制約を用いたゼロ代名詞の文章外照応解析
- 表層情報と非表層情報
- 多言語翻訳技術に関する公開性能評価 : 音声翻訳技術のための国際評価ワークショップIWSLT2004(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 多言語翻訳技術に関する公開性能評価 : 音声翻訳技術のための国際評価ワークショップIWSLT2004(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- 多言語翻訳技術に関する公開性能評価 : 音声翻訳技術のための国際評価ワークショップIWSLT2004(音声・言語における標準化動向)(第6回音声言語シンポジウム)
- COLING-2000参加報告
- 2000-NL-138-5 コーパスからの省略補完ルール獲得環境
- NLC2000-14 コーパスからの省略補完ルール獲得環境
- 翻訳ルールの意味制約と目的言語共起情報を併用した訳語選択
- 1N-6 決定木学習とヒューリスティックスを用いた用言意味属性の自動付与
- 5R-08 対訳コーパス中の規則獲得不適文対の自動認定
- 対訳コーパス中の規則獲得不敵文対の自動認定
- 日英対訳コーパス中のゼロ代名詞とその指示対象の自動認定
- 日英対訳コーパスを用いた文章外照応ゼロ代名詞解析規則の自動獲得
- 日英機械翻訳のための構文辞書
- 日英機械翻訳のための構文辞書
- 日英機械翻訳用スケルトン-フレッシュ型構文意味辞書の構成
- 日英の構文的対応関係に着目した用言意味属性の分類
- 日英翻訳システムにおける用言意味属性を用いたゼロ代名詞照応解析
- 語用論的・意味論的制約を用いた日本語ゼロ代名詞の文内照応解析
- 対訳コーパスから対応する表現対の自動抽出
- 語用論的・意味論的制約を用いた日本語ゼロ代名詞の文内照応解析
- 語用論的・意味論的制約を用いた日本語ゼロ代名詞の文内照応解析
- 翻訳通信に適した意味解析型翻訳技術
- 分野適応型翻訳機構のための翻訳不良表現の自動抽出
- 対訳コーパスを用いた分野適応型翻訳機構
- 書式構造的特徴を用いたゼロ代名詞照応解析
- 日英機械翻訳における文脈処理技術 (特集論文 日英機械翻訳技術)