Web からの属性情報記述ページの発見
スポンサーリンク
概要
- 論文の詳細を見る
This paper presents a method of finding a specification page on the Web for a given object (e.g., ``Ch. dYquem) and its class label (e.g., ``wine). A specification page for an object is a Web page which gives concise attribute-value information about the object (e.g., ``county-``Sauternes) in well formatted structures. A simple unsupervised method using layout and symbolic decoration cues was applied to a large number of the Web pages to acquire candidate attributes for each class (e.g., ``county for a class ``wine). We then filter out irrelevant words from the putative attributes through an author-aware scoring function that we called site frequency. We used the acquired attributes to select a representative specification page for a given object from the Web pages retrieved by a normal search engine. Experimental results revealed that our system greatly outperformed the normal search engine in terms of this specification retrieval.
- 社団法人 人工知能学会の論文
- 2006-11-01
著者
-
鳥澤 健太郎
北陸先端科学技術大学院大学
-
吉永 直樹
東京大学生産技術研究所
-
鳥澤 健太郎
北陸先端科学技術大学院大学情報科学研究科
-
鳥澤 健太郎
独立行政法人情報通信研究機構
-
吉永 直樹
日本学術振興会
関連論文
- イノベーション支援に向けた知識獲得と仮説生成 (データによる分析と評価)
- WWWからの大規模動詞含意知識の獲得
- 確率的シソーラスに基づいたトリガー言語モデルの拡張
- LTAG文法からの変換によるHPSG英文法の作成
- 6 高機能な構文解析器に向けて : HPSGのための実用的な構文解析器 (フィールドを広げる自然言語処理)
- 概念辞書によるシステマティックなイノベーション支援に向けて (データによる分析と評価)
- 属性語の Web 文書からの自動発見と人手評価のための基準
- 一般ユーザーにインタビューする対話エージェント
- 一般ユーザーにインタビューする対話エージェント(対話)
- HTML文書からの単語意味クラスの単純な自動獲得手法(自然言語)