文書の話題構成に基づく重要語の抽出
スポンサーリンク
概要
- 論文の詳細を見る
文書の概要把握の支援用の見出しの自動生成を目指して行った基礎的実験について報告する。長めの報告書の前書き部を除いた3節それぞれに対し、(a)情報検索で広く用いられているtf×idf法による評価の高い語を抽出する場合、(b)文書内単語出現確率に基づく単語の情報量の大きい語を抽出する場合、(c)節内単語出現確率が文書内単語出現確率より有意に高い語を抽出する場合を比較実験し、その性質を分析した。その結果、(1)対象節とその周辺の節との間の出現確率の異なり、(2)対象節内における単語の出現箇所の集中度、の両者の評価を組み合わせることが効果的であるとの結論を得た。tf×idf法と単語出現確率の統計モデルとの関係に関する考察も行っている。
- 一般社団法人情報処理学会の論文
- 1998-07-17
著者
関連論文
- 2-F-10 POS分析とアンケートに基づく大学生協の食育向上の試み(大学でのOR)
- 編集にあたって
- 特集「情報融合」に向けて(情報融合)
- 編集にあたって
- 編集にあたって
- 編集にあたって
- 特集「情報融合」に向けて(情報融合)
- 編集にあたって
- 編集にあたって
- 情報検索タスクに基づく自動要約手法の評価
- 話題の階層構成に基づく関連談話の対応づけ
- 話題の階層構成に基づく関連談話の対応づけ
- 話題の階層構成に基づく文書自動要約 : 本一冊を一頁に要約する試み
- 話題の階層構成に基づく文書自動要約 : 本一冊を一頁に要約する試み
- 文書の話題構成に基づく重要語の抽出
- 見出しを利用した新聞・レポートからのダイジェスト情報の抽出