Web上のハウツー情報の構成要素の抽出
スポンサーリンク
概要
- 論文の詳細を見る
Web 情報検索の目的は多様化しているが,レシピやソフトウェアのインストール方法などのハウツー情報の需要は高い.そこで,本研究では,ハウツー情報の構成要素を "手順" と考え,"手順" を "動作" と "対象" のペアでモデル化する.さらに,Web ページから手順を抽出する手法を提案する.手順の抽出の際は,文末表現に注目して手順を説明する文のみを発見し,それらの文に対して,動詞と目的語を発見して,動作と対象とみなす.また,対象が省略されている文に対しては,前の文から対象を補う.提案手法の評価を行ったところ,平均で適合率が 0.49,再現率が 0.57,F 値が 0.51 という結果であった.結果を分析したところ,対象の補完,慣用句による動作の表現などの問題があることがわかった.
- 2011-10-27
著者
関連論文
- Web上での概念間の共通性に基づく比較可能性の判定
- ソーシャルタグの上位下位関係に基づく散策的ブラウジング支援
- 論点に対する極性に注目したニュース記事からの編集意図の抽出手法
- 関連ニュース記事集合内の特異箇所に注目した発信者意図の抽出(セッション6a:情報抽出・検索)
- 検索傾向の部分的な類似に基づくトピッククラスタリング(セッション6a:情報抽出・検索)
- ソーシャルブックマークの生成間隔に基づくコンテンツライフサイクルの提案(セッション2a:Web Mining and Analysis)
- 検索行動の再利用のための検索クエリのトピック変換(Web解析・検索クエリ)
- 検索行動の再利用のための検索クエリのトピック変換(Web解析・検索クエリ)
- Webページに対する典型的なクエリの発見(夏のデータベースワークショップ2007(データ工学,一般))
- Webページに対する典型的なクエリの発見(マイニング,夏のデータベースワークショップ2007(データ工学,一般))
- 実トラフィックを用いたネットワーク不正侵入検知システムのための学習データ生成支援アプリケーションの開発
- Webページの構造と内容の分析による手法掲載部分の抽出
- 実時間映像伝送システムの総合遅延時間の一計測法
- 検索・統合によるマルチメディアコンテンツの組織化(研究会推薦博士論文速報)
- Webページ集合を解とする全容検索(情報融合)
- D-11-75 擬似同期式点滅マーカ法による実時間映像の総合遅延時間計測(D-11.画像工学,一般セッション)
- D-11-71 HMDを用いる実時間映像システムの総合遅延時間計測(D-11.画像工学,一般セッション)
- 語の連想関係に基づく文章の典型性の可視化
- 説明からの用語検索のための緩和によるクエリ生成とページ中の位置を考慮した用語抽出
- Web上のハウツー情報の構成要素の抽出
- 実時間映像伝送システムの総合遅延時間の一計測法
- 同期式点滅マーカ法による実時間映像伝送の総合遅延時間計測(教育・訓練・協調)
- 語の共起と極性に基づく商品レビュー閲覧支援システム
- カテゴリに対する所属度と典型度を考慮した希少なWebページの発見
- B-6-121 受信バッファの使い方の総合遅延時間特性への影響の一例(B-6.ネットワークシステム,一般セッション)
- B-6-122 総合遅延時間計測を行う同期式点滅マーカ法の自動化の一試行(B-6.ネットワークシステム,一般セッション)
- エージェント行動記録からの意思決定規則抽出