語の近接性に基づいた意味段落境界の判定手法(解析)
スポンサーリンク
概要
- 論文の詳細を見る
本稿は語と語の近接性に着目して語彙結束度を求め, 意味的にまとまった段落(意味段落)に分割する手法について提案する.ことばの組み合わせが無数にあるのに文章表現がばらばらに遊離せずにまとまりをもつ働きには, 文に生起する語と語の近接する位置的関係にあるという仮説のもとに, 文間結束度, 話題結束度を求め, これらが意味結束度を表すとして意味段落境界の判定を行った.タイトル部を除去した社説記事を連結し, 記事の区切りが本手法による境界判定と一致したときを正解とする評価実験を行った.その結果, 再現率で63.9%, 適合率で27.1%の結果を得た.本手法は小さなテキストに対しても有効であり, 小説に対しても適用し考察を行った.
- 一般社団法人情報処理学会の論文
- 2005-03-10
著者
-
足立 顕
西テレ情報サイエンス株式会社臼杵研究所
-
中野 滋徳
東邦大学大学院理学研究科情報科学専攻
-
牧野 武則
東邦大学大学院理学研究科情報科学専攻
-
足立 顕
富士通株式会社報道メディアシステム統括部
関連論文
- 語の反復距離に基づく段落境界の認定
- 語の近接性に基づいた意味段落境界の判定手法(解析)
- 提題表現に基づく重要段落抽出(セグメンテーション・要約)
- 複文構造における言い換えについて(機械翻訳・言い換え)
- 依存ネットワークをもとにしたパラグラフ要約(生成・要約)
- 柔軟な文生成方式(生成・要約)
- 依存構造を利用した言い換え文の自動生成(言い換え,文法)
- Refining algorithm of pattern rule set for detecting noun phrases in English
- 表層格と動詞の関係に基づく動詞の自動分類
- 統計的手法を用いた日本語文の照応・省略における特徴解析
- チャートを用いたトップダウンによる文生成