提題表現に基づく重要段落抽出(セグメンテーション・要約)
スポンサーリンク
概要
- 論文の詳細を見る
日本語には係助詞「は」「も」などを用いた強調表現がある.係助詞は語に付属し,付属した語句を文および段落の中心的話題である提題表現とする機能を持つ.本稿では,係助詞を伴う提題表現に基づいた重要段落の抽出について述べる.文章中に記述している語をベクトル化し,段落ごとに得たベクトルとの内積値を計算することで重要段落を得る.実験では,ニュース報道記事を用いた比較的大きなコーパスを対象に抽出精度の評価を行った.その結果,毎日新聞記事61.2%,日経新聞記事77.9%の抽出精度を得た.考察では,社説を用いた実験結果について述べる.
- 一般社団法人情報処理学会の論文
- 2004-07-15
著者
-
足立 顕
西テレ情報サイエンス株式会社臼杵研究所
-
中野 滋徳
東邦大学大学院理学研究科情報科学専攻
-
牧野 武則
東邦大学大学院理学研究科情報科学専攻
-
足立 顕
富士通株式会社報道メディアシステム統括部
関連論文
- 語の反復距離に基づく段落境界の認定
- 語の近接性に基づいた意味段落境界の判定手法(解析)
- 提題表現に基づく重要段落抽出(セグメンテーション・要約)
- 複文構造における言い換えについて(機械翻訳・言い換え)
- 依存ネットワークをもとにしたパラグラフ要約(生成・要約)
- 柔軟な文生成方式(生成・要約)
- 依存構造を利用した言い換え文の自動生成(言い換え,文法)
- Refining algorithm of pattern rule set for detecting noun phrases in English
- 表層格と動詞の関係に基づく動詞の自動分類
- 統計的手法を用いた日本語文の照応・省略における特徴解析
- チャートを用いたトップダウンによる文生成