Max FlowアルゴリズムによるWebページのクラスタリング方法(Web検索, 夏のデータベースワークショップDBWS2005)
スポンサーリンク
概要
- 論文の詳細を見る
Web上の情報を探すために使われる検索エンジンの多くはユーザに検索結果をスコア順のリストとして返す.従って, リストが長い場合, 求める情報を探すのは極めて難しい.そこで, 検索結果をリストでなくクラスタリングして表示する方法を提案する.クラスタリングする方法としては, ページ内の文章を解析する方法でなくWebページのもつリンク情報を基に行う.リンク情報の解析には, より緻密に結びついたリンク構造にあるページ集合を見つけるのに有効な最大流アルゴリズムを用いる.提案方法を定量的に評価するために, 適合の正解があるNTCIRのデータを使い実験を行い良好な結果を得た.
- 一般社団法人情報処理学会の論文
- 2005-07-13
著者
-
太田 学
岡山大学大学院自然科学研究科
-
石川 博
静岡大学情報学部情報科学科
-
大野 成義
職業能力開発総合大学校情報システム工学科
-
石川 博
静岡大学情報学部
-
大野 成義
職業能力開発総合大学校
-
渡辺 匡
東京都立大学大学院工学研究科
-
片山 薫
東京都立大学大学院工学研究科
-
石川 博
東京都立大学大学院工学研究科
-
片山 薫
首都大学東京システムデザイン研究科
-
太田 学
学術情報センター研究開発部
関連論文
- 地球科学への応用に向けたWikipedia上の時空間データ抽出と可視化(Webインタフェース/Wikipedia,e-Science及びData Intensive Science)
- 関係データベースを利用したXMLリポジトリのためのアクセス管理手法
- Tiled Displayを用いた大規模センシングデータの可視化システム (データ工学)
- インクリメンタルに更新可能なXPushマシンの性能向上と応用に関する考察(夏のデータベースワークショップ2007(データ工学,一般))
- インクリメンタルに更新可能なXPushマシンの性能向上と応用に関する考察(XML (2),夏のデータベースワークショップ2007(データ工学,一般))
- D-8-1 特定用途向け簡易Web検索システムの自動構築に向けて(D-8. 人工知能と知識処理,一般セッション)
- 多様性を考慮したWebブログマイニングの研究(ウェブ情報とデータベースに関して(ポスター講演))
- 単語の特徴量を考慮した検索結果クラスタに関する多視点融合型スニペットの構築(セッション8a:Web検索)
- センサネットワークを利用した省電力化のための人物誘導(セッション5c:セキュリティ・プライバシー)
- ブログ記事からのトピック別評判情報変遷パタンの抽出手法について(夏のデータベースワークショップ2007(データ工学,一般))