テキストのwriting-style依存構造と冠詞
スポンサーリンク
概要
- 論文の詳細を見る
書き手の思考のカオスがひとまとまりのテキストの形に言語表現されるまでの過程ではさまざまの知識を使いながら情報を構造化していくと考えられる。人間の場合は、思考そのものが特定の言語に基付いて行われている部分が多く、深部の思考から表層のテキストにまとまっていく過程におけるさまざまな知識の適用も、順次的というよりも高次並列的と考えられる。これに対し機械によるテキスト生成では、書き手の思考内容に相当する非言語依存的な意味表現から出発し、それにたいして言語的な知識や常識に相当する世界知識を適用しながら目的言語によるテキストを生成していく方が、現実的である。また、人間の書いたテキストの場合、同じ内容に付いて書かれたテキストでも書き手のwriting-styleに依存する表現の違いがある。機械による生成においても生成のスタイルに基付いて、テキストの表現構造を組み立てていく。writing-styleと言うと、書き手によって異なる捉えどころのないもののように考えられがちであるが、この過程も場当たり的な処理ではなく、秩序立って支配している法則のある過程と考えられる。すなわち、非writing-style依存的なテキストの表現構造に対して書き手と読み手の間に共有していることを前提とするwriting-styleに関する知識(以下ではwriting-style知識)を使いながら、writing-styleに依存した構造(以下writing-style依存構造)を表現していくと考えられる。writing-style知識も構造化した知識であり、蓄積され共有され、テキスト解析にも生成にも共通に使われる知識である。筆者らはこれまでの研究で、言語知識や世界知識と共に、現実の題材に即した実際的な知識として複数パラグラフよりなるテキストのパラグラフ構成に関する知識をテキスト生成に取り入れてきたが、このような知識もwriting-style知識として構造化した知識の一部として位置付けられる。本稿では、writing-style知識とwriting-style依存構造のテキスト生成過程における重要性を指摘すると共に、テキストの意味とwriting-styleとの区別を知識表現のレベルの違いとして把握し、writing-style依存構造がテキストに反映している具体例として、実際の英語テキストを組立ているユニット(パラグラフ、文)間の構造と冠詞の関係に付いて検討する。
- 社団法人情報処理学会の論文
- 1991-02-25
著者
関連論文
- 文脈情報変換型機械翻訳システムCONTRAST : 解析・生成・知識表現
- コモンジョの翼に乗った永遠の少女 : 上花輪歴史館副館長 ≪高梨節子さん≫
- 英語テキスト構造と冠詞現象
- テキストのwriting-style依存構造と冠詞
- テキストにおける首尾一貫性(coherence)と文脈表現構造
- 実験的な知識に基づく文脈表現構造からの英語テキスト生成
- 機械翻訳システムCONTRASTにおける文脈情報の利用