自然言語文からの構造化クエリの自動生成によるWeb情報検索(Web解析・検索クエリ)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,日本語の自然言語文クエリを解析し,その結果をもとにクエリを構造化する手法を提案する.自然言語文クエリの解析には,形態素解析と係り受け解析を用いる.そして,得られる文節や係り受け関係などの情報をもとに文を構造化し,その構造をもとにクエリを生成する.このように構造化されたクエリを用いて検索を行うことで自然言語文に適用し,高効率を維持しつつ高精度な検索が可能となる.提案手法を評価するため,主に日本語で記述された100GBのwebテキストコレクションを用いて,文節や係り受け関係などの情報を用いた場合とそうでない場合を比較した.その結果,検索精度が約8.5%向上した.さらに提案手法を擬似適合フィードバックと組み合わせたところ,約21.3%向上した.
- 2008-06-12
著者
関連論文
- 意見文検索のための言語モデルにおける局所文脈スムージング(自然言語処理,情報検索,情報爆発論文)
- 潜在トピックを用いたブログ空間からの情報伝搬ネットワーク抽出(情報検索 Web情報システム,データ工学論文)
- 情報検索のための確率的言語モデルに関する動向と課題(情報検索,データ工学論文)
- 多型トピックモデルを用いたアノテーション付き文書に対する検索手法(テキストマイニング,データ工学論文)
- 多重多型トピックモデルを用いたアノテーション付きテキストからのエンティティ検索(Wikipedia)
- カテゴリ階層構造を考慮した確率的トピックモデルとその応用
- カテゴリ階層構造を考慮した確率的トピックモデルとその応用
- 2-102 プログラミング相談室 : 全員の基礎スキルレベルアップのために((2)専門科目の講義・演習-I,口頭発表論文)
- 情報検索のための確率的言語モデル
- 時系列対訳トピックモデルを用いた言語横断トレンド分析
- 意見文検索のための言語モデルにおける局所文脈スムージング
- 意見文検索のための言語モデルにおける局所文脈スムージング
- 混合メンバーシップ・ブロックモデルを用いた協調フィルタリング
- 混合メンバーシップ・ブロックモデルを用いた協調フィルタリング
- 時系列対訳トピックモデルを用いた言語横断トレンド分析
- 情報検索のための確率的言語モデル
- 3N-2 時系列トピックモデルを用いた言語横断トレンド分析(数理モデルとデータマイニング,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 大規模ネットワーク構造の確率的グループモデルに基づくリンク予測
- 多重多型トピックモデルを用いたアノテーション付きテキストからのエンティティ検索(Wikipedia)
- 学術文献の潜在トピックに着目したタンパク質相互関係に関する知識の抽出
- 2ZL-2 確率的トピックモデルを用いた医学生物学文献情報に基づく仮設生成(バイオインフォマティクスと医療,学生セッション,コンピュータと人間社会,情報処理学会創立50周年記念)
- 5J-5 トピック依存型意見検索モデルの開発とブログに対する評価(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 1R-6 重回帰分析を用いた近接クエリの重み推定によるWeb情報検索(Web検索支援,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- カテゴリ構造を用いた確率的トピックモデルの効率的推定とその応用
- カテゴリ構造を用いた確率的トピックモデルの効率的推定とその応用
- 多言語トピックモデルによる言語横断リンク検出
- 多言語トピックモデルによる言語横断リンク検出
- Collapsed変分ベイズLDAによるタンパク質相互作用予測(医用情報処理)
- Collapsed変分ベイズLDAによるタンパク質相互作用予測(医用情報処理)
- 正則化付きリンク構造解析を用いたコールドスタート推薦
- MPI/OpenMPハイブリッド並列化による潜在的ディリクレ配分法の効率的推定(統計的言語処理,テキスト・Webマイニング,一般)
- 自然言語文からの構造化クエリの自動生成によるWeb情報検索(Web解析・検索クエリ)
- 自然言語文からの構造化クエリの自動生成によるWeb情報検索(Web解析・検索クエリ)
- 映像データにおける局所特徴のバースト性を考慮したトピックモデリング(一般セッション,一人称ビジョン,セキュリティとプライバシーの確保,産学共同研究紹介)