頑健な文脈処理のパラダイム : 文脈依存性を考慮した自然言語処理
スポンサーリンク
概要
- 論文の詳細を見る
Discourse processing has been widely recognized as a key technology for improving the accuracy of text analysis, but it has also been considered a high cost procedure that requires an enormous amount of background knowledge and deep inference mechanisms. However, without constructing a precise model of the discourse through deep semantic analysis, rich information for resolving ambiguities in sentence analysis, including various discourse-dependent problems, can be obtained by analyzing a simple set of parsed trees of each sentence in a text. For example, if it is assumed that morphologically identical words within a discourse have the same word sense and modify or are modified by similar words, the results of word sense and attachment disambiguation applied in one sentence can be shared with all other morphologically identical words within the discourse. Besides facilitating information on word sense and attachment disambiguation, processing a whole text at one time makes it possible to refer to other information in the discourse, such as word frequency and the position of each word, which can be used for resolving pronoun reference and the focus of focusing subjuncts, such as also and only, as well as for adding supplementary phrases in some elliptical sentences. We have developed a method of sentence analysis based on a simple discourse model that improves the accuracy of a natural language processing system, in particular, a machine translation system. Our framework is highly practical, since it does not require any knowledge resources that have been specially hand-coded for discourse processing, or a deep inference mechanism; instead, it uses syntactic information on all the other words in the discourse, such as modifiee-modifier relationships and position in the text. Moreover, our approach is fundamentally different from previous approaches to discourse processing, in that it does not consider any discourse structure and is aimed at improving the accuracy of natural language processing rather than obtaining a perfect analysis. In this paper, we describe our robust discourse processing method, focusing on its effect in a machine translation system.
- 社団法人人工知能学会の論文
- 1996-11-01
著者
関連論文
- テキストマイニングの普及に向けて : 研究を実用化につなぐ課題への取組み
- コールセンターにおける目的を持ったビジネス会話のモデリングと会話マイニングへの応用
- 木構造変換を利用した評判分析手法
- パターンベース翻訳システムPalmTreeの文脈処理
- テキストマイニングのための情報抽出
- テキストマイニングのための情報抽出
- 大量のテキストからの知識マイニング
- 知識発見のためのテキストマイニング技術
- 4N-6 知識発見のためのテキストマイニング技術
- テキストマイニングのための情報抽出手法
- 表層的な文脈情報を用いた自然な文生成の試み
- 知識ベースを利用した機械翻訳システムShalt2 ( 自然言語処理の実動システム)
- 英日機械翻訳システムShalt2における並列句の取り扱い
- 編集にあたって(使いやすくなった自然言語処理のフリーソフト : 知っておきたいツールの中身)
- 文脈制約と文脈選好を利用した文脈処理システムDIANA
- 2 テキストマイニング : 膨大な文書データの自動分析による知識発見 (フィールドを広げる自然言語処理)
- テキストマイニング : 膨大な文書データからの知識獲得 : 概要
- テキストマイニング : 膨大な文書データからの知識獲得 : 意図の認識
- 編集にあたって (フィールドを広げる自然言語処理)
- コールセンターにおけるテキストマイニング(「テキストマイニング」)
- テキストマイニング基盤技術(「テキストマイニング」)
- 頑健な文脈処理のパラダイム : 文脈依存性を考慮した自然言語処理
- 文や句による日本語テキストの検索 : 語と語の係り受けを用いた検索の試み
- 文脈情報を利用した自然言語文における構造的曖昧性の解消
- ACL'95会議報告
- 文脈情報を利用した不適格文の構文解析
- 自然言語解析における複数文一括処理手法
- 自然言語処理システムにおける出力信頼度の自動評価
- 文脈制約を利用した曖昧性解消