編集距離を組み込んだWrapperによる類似タグ構造を持つ情報の抽出
スポンサーリンク
概要
- 論文の詳細を見る
近年インターネットの発達によってWeb上に膨大な量の情報が存在するようになった.<br />それによりユーザは自由に情報を得られるようになった一方で,ユーザにとって必要な情報のみを得ることは時間と手間を要するようになった.<br />そこで,本研究ではHTMLなどのWebページから特定の情報を自動的に抽出するための,ページレイアウトを利用した抽出ルール及び抽出プログラムであるWrapperに着目している.<br />そして,編集距離を組み込むことでWebページの構造の類似性を求め,構造に着目したWrapperを生成し,自動的に特定の情報を抽出する手法を提案する.<br />これによりページレイアウトが異なるサイトにおいても同様に必用な情報のみを抽出することが可能である.
- 2011-03-02
著者
関連論文
- 1X-5 アクセスモニタとファイルバックアップの統合による自己修復機構の設計(セキュア設計・実装・フォレンジクス,学生セッション,セキュリティ)
- 4P-8 生物シミュレーション構築のための確率的構文を導入した論理型言語の提案(プログラミング言語,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- F-026 Swingによる視覚化を利用した肝細胞癌再発予測支援(F分野:人工知能・ゲーム,一般論文)
- L-032 ファイルバックアップとアクセスモニタの統合による自己修復機構の設計(ネットワーク・セキュリティ,一般論文)
- F-039 帰納論理プログラミングを用いたWebラッパー自動生成(人工知能・ゲーム,一般論文)
- 3R-6 帰納論理プログラミングを用いたWebラッパー自動生成(学習,学生セッション,人工知能と認知科学)
- 3P-2 書籍情報から得た個人情報のソーシャルネットワークヘの活用(情報管理とシステム,学生セッション,データベースとメディア)
- 赤外線通信を用いたプロトコル分析支援システムの開発
- 編集距離を組み込んだWrapperによる類似タグ構造を持つ情報の抽出