自然言語処理を用いた日本語文書自動整形システム
スポンサーリンク
概要
- 論文の詳細を見る
近年,計算機を用いた文書整形技術は格段に進歩してきた.T_EXと呼ばれる自動組版システムやPOSTSCRIPTと呼ばれる文字図形の記述言語の出現で電子出版が容易にできるようになった.これらの技術を利用すると従来の日本語行組版を変えるような新しい試みが可能となる.本論文では,日本語のべた詰め表記に対して欧米言語で取られているような単語分かち書きに近い手法の文書整形を提案し,実験システムの概要を述べる.整形処理は整形規則に基づいて実行しており,文書の種類によって異なる整形を施すことが可能となる.整形規則は単語や文字のサイズ,単語や文字の間隔を単語の見出しや品詞,構文構造などを用いて記述するため自然言語処理技術が必須となる.これらの規則を組み合わせると特定の単語を大きくしたり,助詞を小さくしたり,平仮名の続く文節の間には少し隙間を入れたりすることが可能になる.実験の結果,従来のモノスペース組版と比較してプロポーショナル組版の持つ読みやすさや自然さを出すことが可能になった.
- 一般社団法人情報処理学会の論文
- 1995-06-15
著者
-
安原 宏
沖電気工業(株)総合システム研究所
-
小山 法孝
沖電気工業株式会社研究開発本部マルチメディア研究所
-
安原 宏
沖電気工業株式会社 マルチメディア研究所
-
安原 宏
沖電気工業(株)研究開発本部
関連論文
- 要約支援システムCOGITO : 言語解析部
- ハイパーキューブ網の有向グラフ上に構成されるデッドロックフリーなルーティング方式
- 要約支援システムCOGITO (自然言語理解)
- 要約支援システムCOGITOの文脈表現形式
- 自然言語処理を用いた日本語文書自動整形システム
- 要約支援システムCOGITOにおける文章の重要性評価について
- 共起データを用いた係り受け解析の学習効果
- 形態素情報による日本語の係り受け解析
- 縮退型共起関係を用いた学習機能付き係り受け解析システム
- 特集「自然言語処理の再構築」にあたって
- コスト最小法形態素解析のコストルール作成実験
- 要約支援システムCOGITO : 「テキスト・パーサ」によるテキスト解析