Web からの属性情報記述ページの発見
スポンサーリンク
概要
- 論文の詳細を見る
This paper presents a method of finding a specification page on the Web for a given object (e.g., ``Ch. dYquem) and its class label (e.g., ``wine). A specification page for an object is a Web page which gives concise attribute-value information about the object (e.g., ``county-``Sauternes) in well formatted structures. A simple unsupervised method using layout and symbolic decoration cues was applied to a large number of the Web pages to acquire candidate attributes for each class (e.g., ``county for a class ``wine). We then filter out irrelevant words from the putative attributes through an author-aware scoring function that we called site frequency. We used the acquired attributes to select a representative specification page for a given object from the Web pages retrieved by a normal search engine. Experimental results revealed that our system greatly outperformed the normal search engine in terms of this specification retrieval.
- 社団法人 人工知能学会の論文
- 2006-11-01
著者
-
鳥澤 健太郎
北陸先端科学技術大学院大学
-
吉永 直樹
東京大学生産技術研究所
-
鳥澤 健太郎
北陸先端科学技術大学院大学情報科学研究科
-
鳥澤 健太郎
独立行政法人情報通信研究機構
-
吉永 直樹
日本学術振興会
関連論文
- イノベーション支援に向けた知識獲得と仮説生成 (データによる分析と評価)
- WWWからの大規模動詞含意知識の獲得
- 確率的シソーラスに基づいたトリガー言語モデルの拡張
- LTAG文法からの変換によるHPSG英文法の作成
- 6 高機能な構文解析器に向けて : HPSGのための実用的な構文解析器 (フィールドを広げる自然言語処理)
- 概念辞書によるシステマティックなイノベーション支援に向けて (データによる分析と評価)
- 属性語の Web 文書からの自動発見と人手評価のための基準
- 一般ユーザーにインタビューする対話エージェント
- 一般ユーザーにインタビューする対話エージェント(対話)
- HTML文書からの単語意味クラスの単純な自動獲得手法(自然言語)
- 対象の用途と準備を表す表現の自動獲得
- HTML文書からの単語間の上位下位関係の自動獲得
- HTML文書中の箇条書きとその表題に注目した下位語の自動獲得(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- HTML文書中の箇条書きとその表題に注目した下位語の自動獲得(情報抽出・単語分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- HTML文書からの単語間の上位下位関係の自動獲得(獲得,辞書)
- HTML文書からの単語間の上位下位関係の自動獲得(獲得, 辞書)(言語理解とコミュニケーション)
- 3つ以下の候補から係り先を選択する係り受け解析モデル
- 並列HPSGパーザーに向けて
- HPSGから有限状態オートマタへ
- Wikipedia の記事構造からの上位下位関係抽出
- 5J-2 Wikipediaの階層構造を知識源とする上位下位関係の自動獲得(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Web からの属性情報記述ページの発見
- 3K-1 自然言語処理における系列ラベリング問題のための高速で厳密な漸次的複合化アルゴリズム(情報爆発時代におけるテキスト処理・Wikipedia,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 3K-2 組み合わせ素性に基づく分類器の効率的学習法(情報爆発時代におけるテキスト処理・Wikipedia,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 単語分布類似度を用いた類推による単語間の意味的関係獲得法
- Web時代の音声・言語技術
- Co-STAR:上位下位関係獲得のための共訓練アルゴリズム
- 分布類似度とWikipediaから獲得した構造情報を利用した上位下位関係獲得
- 大規模分布類似度計算のためのベイズ手法を用いた新しい類似尺度
- 言語横断共訓練による単語間の上位下位関係の獲得
- Webテキストを対象とした語義曖昧性解消のための言語資源の半自動構築
- マイクロブログ上の流言に対するユーザの態度の分類(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- マイクロブログ上の流言に対するユーザの態度の分類(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 係り受け解析を用いたブログユーザの行動・興味に関する時系列推移3次元可視化システム(データ工学,Web情報システム)
- 係り受け解析を用いたブログユーザの行動・興味に関する時系列推移3次元可視化システム
- 時系列テキストを用いた恒久性と一意性に基づく関係の分類(自然言語処理,学生論文特集秀逸論文,学生論文)
- 聞き手の感情を喚起する発話の分類と生成(感情・評価・態度)
- 聞き手の感情を喚起する発話の分類と生成(感情・評価・態度)
- 時系列テキストを用いた恒久性と一意性に基づく関係の分類