webページ中のテキストと表からの重要個所抽出
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、情報の信頼度を考慮して低品質なマルチドキュメントであるwebページ中のテキストと表から重要個所を抽出する手法について述べる。テキストや表に付けられた見出しをテキストや表の内容から抽出した重要個所との類似度で内容を評価してから抽出する重要個所を決めることにより、単純に表示上強調された個所を抽出したり、テキストの表層情報から重要個所を抽出する場合に比べ、より信頼度の高い重要個所が抽出できると考えられる。tf^*idf、χ^2値を用いて重要個所を抽出した場合と本手法で用いた上位概念の出現頻度を用いて重要個所を抽出した場合の精度の比較から本手法の有効性を検証する。
- 社団法人情報処理学会の論文
- 2003-01-20
著者
-
大西 昇
名古屋大学大学院情報科学研究科
-
松本 哲也
名古屋大学大学院情報科学研究科メディア科学専攻
-
竹内 義則
名古屋大学情報連携統括本部情報戦略室
-
工藤 博章
名古屋大学大学院情報科学研究科メディア科学専攻
-
佐藤 慎哉
名古屋大学大学院工学研究科
-
山村 毅
愛知県立大学情報科学部
-
竹内 義則
名古屋大学情報セキュリティ対策推進室
-
山村 毅
愛知県立大学 情報科学部
-
大西 昇
名古屋大学 大学院 工学研究科 情報工学専攻
-
松本 哲也
名古屋大学大学院
-
工藤 博章
名古屋大学大学院情報科学研究科
-
竹内 義則
名古屋大学 情報セキュリティ対策推進室
-
工藤 博章
名古屋大学大学院工学研究科情報工学専攻
-
大西 昇
名古屋大学
関連論文
- 難聴者のための,会議における発言聴取支援システム(肢体障害・聴覚障害,HCGシンポジウム)
- 自己運動感覚を誘導する視覚刺激に対する生体反応の分析
- 自己運動を誘導する視覚刺激に対する生体反応の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 自己運動を誘導する視覚刺激に対する生体反応の計測
- 3次元形状手がかりに基づく陰影からの表面反射特性知覚(ヒューマンインフォメーション)
- 視聴覚事象の中心的事例の教師なし学習
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション6)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 吹き付けによる3次元形状モデリングの提案
- 三次元CGにおけるカメラワークの自動生成