文間文脈と文内文脈を利用した日本語複文における省略要素の復元
スポンサーリンク
概要
- 論文の詳細を見る
一般に自然言語では, 情報伝達の効率化を図るため, 他の手段(共有知識を含む)で伝達可能な情報は明示しないという原則の下, 多くの省略表現が使用されている。日本語では特にこの傾向が著しく, 日本語解析システムにおいては省略要素の復元が大きな課題となってきた。最近ではセンタリング理論を応用した研究が広く行われているが, 対象は主に単文間のローカルな結束性である。そこで, 日本語の複文における省略復元の精度を向上するために, 用言の意味属性や接続語の情報を利用する手法や, これらの情報とセンタリング理論を組み合わせる手法が提唱されている。筆者らもこれまでに, 「複文中の用言間の接続語のレベル」と「述語の変化素性」に基づいて日本語複文・重文の文構造を推定する語彙文脈文法(Lexical Discourse Grammar:以下, LDG)を提唱し, 省略要素の復元にも応用を図っている。LDGの特徴は, 文中の語彙の持つ機能情報を利用して, 構文・意味解析に先立って大局的な文構造を推定することにある。以下, 始めにLDGの概要を説明し, 続いてLDGに基づく日本語複文における省略要素の復元手法について述べる。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
関連論文
- 開発者の視点からの機械翻訳システムの技術的評価 : テストセットを用いた晶質評価法
- 用例に基づいて英語前置詞の訳し分けを行う英日翻訳システム
- 自然言語を用いて家庭機器操作を行う対話システム
- E-55 大規模言語知識を用いた既存の語彙翻訳規則からの類似語彙規則半自動生成(機械翻訳(2),E.自然言語・文書)
- 文内共起頻度データを利用した段落内共起に基づく訳語選択
- 文間文脈と文内文脈を利用した日本語複文における省略要素の復元