従属節の階層構造に基づく日本語長文の自動分割とその効果
スポンサーリンク
概要
- 論文の詳細を見る
現実の日本語文書には多数の長文が含まれ,構文解析や意味解析などの機械処理を行なう上での障害となっている。特に日英機械翻訳では,長文自体が解析失敗や生成失敗の原因となりやすいだけでなく,英訳されたとしても,原文と訳文の対応が取りにくいため,後編集が困難になるという問題もある。これらを解決するには長文分割が有効であり,人手による前編集の一環としてしばしば行なわれるほか,前編集支援の課題として検討されてきた。しかし,文分割のルールは原文と訳文の比較分析に基づいて経験的に作成されており,日本語原文から見た場合の分割の必然性は不明確であった。本稿では,従属節の階層的な関係[南74]に着目することにより日本語の長文を自動的に分割する方法を提案する。具体的には,接続の種類[白井95b]を考慮することにより適切な分割が可能になること,それにより日英機械翻訳の訳文品質が向上することを示す。
- 一般社団法人情報処理学会の論文
- 1996-09-04
著者
-
白井 諭
Ntt-アドバンステクノロジ株式会社
-
白井 諭
国際電気通信基礎技研
-
白井 諭
Nttコミュニケーション科学研究所
-
横尾 昭男
Nttコミュニケーション科学基礎研究所
-
木村 淳子
Nttアドバンステクノロジ(株)
-
瀬下 貴加子
NTTアドバンステクノロジ(株)
-
池原 悟
鳥取大学 工学部 知能情報工学科
関連論文
- 日本語語彙大系について
- 心的状態の解析のための対話行為タグ付きテキスト対話コーパスの試作(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 心的状態の解析のための対話行為タグ付きテキスト対話コーパスの試作(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 心的状態の解析のための対話行為タグ付きテキスト対話コーパスの試作(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- AS-4-6 漫画における表情に着目した情緒注釈付き対話コーパスの作成(AS-4.円滑なコミュニケーション,シンポジウム)
- 意味類型構築のための文接続表現の体系化
- 機械翻訳のための日英文型パターン記述言語
- 機械翻訳のための日英文型パターン記述言語
- 等価的類推思考の原理による機械翻訳方式
- 市況速報文を対象とする用例利用型日英機械翻訳